From e8cf7f32f56a53022baf4e09ff7f9a9e2a1d66f6 Mon Sep 17 00:00:00 2001
From: Yina Chen <33650826+cyita@users.noreply.github.com>
Date: Wed, 23 Oct 2024 09:26:01 +0300
Subject: [PATCH] npu gw small fix (#12249)

---
 .../llm/src/ipex_llm/transformers/npu_models/mp_models_base.py  | 2 +-
 1 file changed, 1 insertion(+), 1 deletion(-)

diff --git a/python/llm/src/ipex_llm/transformers/npu_models/mp_models_base.py b/python/llm/src/ipex_llm/transformers/npu_models/mp_models_base.py
index 0080b40a..d918e4a7 100644
--- a/python/llm/src/ipex_llm/transformers/npu_models/mp_models_base.py
+++ b/python/llm/src/ipex_llm/transformers/npu_models/mp_models_base.py
@@ -103,7 +103,7 @@ def run_model(
 class LLMBaseNNFactory(NNFactory):
 
     def __init__(self, max_seq_len, transpose_value, dtype, profile=False, device="NPU",
-                 n_splits_linear=1, n_splits_down_proj=1, group_size=False):
+                 n_splits_linear=1, n_splits_down_proj=1, group_size=0):
         super().__init__(profile, device)
         self.cache_parameter_ops = []
         self.input_ops = []