Update runtime configuration on MTL (#12720)

2025-01-20 11:06:37 +08:00 · 2025-01-20 11:06:37 +08:00 · 9aa4be8ced
commit 9aa4be8ced
parent bda87c21eb
1 changed files with 0 additions and 1 deletions
--- a/python/llm/src/ipex_llm/transformers/npu_models/convert_mp.py
+++ b/python/llm/src/ipex_llm/transformers/npu_models/convert_mp.py
@ -34,7 +34,6 @@ def optimize_llm_pre(model: torch.nn.Module, qtype, mixed_precision,
                     quantization_group_size=0, load=False, max_prompt_len=512):
    if os.environ.get("IPEX_LLM_NPU_MTL", "0") == "1":
        # For MTL support
        os.environ["IPEX_LLM_NPU_USE_LEVEL0"] = "0"
        os.environ["IPEX_LLM_NPU_DISABLE_COMPILE_OPT"] = "1"
    if os.environ.get("IPEX_LLM_NPU_ARL", "0") == "1":