Update fastchat demo script (#12367)

* Update README.md * Update vllm_docker_quickstart.md
2024-11-08 15:42:17 +08:00 · 2024-11-08 15:42:17 +08:00 · fad15c8ca0
commit fad15c8ca0
parent 51f7f87768
2 changed files with 6 additions and 2 deletions
--- a/docker/llm/serving/xpu/docker/README.md
+++ b/docker/llm/serving/xpu/docker/README.md
@ -103,6 +103,8 @@ To set up model serving using `IPEX-LLM` as backend using FastChat, you can refe
    # start controller
    python -m fastchat.serve.controller &

+    export USE_XETLA=OFF
+    export SYCL_PI_LEVEL_ZERO_USE_IMMEDIATE_COMMANDLISTS=2
    
    export TORCH_LLM_ALLREDUCE=0
    export CCL_DG2_ALLREDUCE=1
--- a/docs/mddocs/DockerGuides/vllm_docker_quickstart.md
+++ b/docs/mddocs/DockerGuides/vllm_docker_quickstart.md
@ -832,6 +832,8 @@ We can set up model serving using `IPEX-LLM` as backend using FastChat, the foll
    # start controller
    python -m fastchat.serve.controller &

+    export USE_XETLA=OFF
+    export SYCL_PI_LEVEL_ZERO_USE_IMMEDIATE_COMMANDLISTS=2
    
    export TORCH_LLM_ALLREDUCE=0
    export CCL_DG2_ALLREDUCE=1