hot-fix mistral kv_cache (#9528)

2023-11-24 14:33:04 +08:00 · 2023-11-24 14:33:04 +08:00 · 3d24823cda
commit 3d24823cda
parent 42b7a16bc5
1 changed files with 5 additions and 0 deletions
--- a/python/llm/src/bigdl/llm/transformers/models/mistral.py
+++ b/python/llm/src/bigdl/llm/transformers/models/mistral.py
@ -114,6 +114,11 @@ def mistral_attention_forward(
                                                       dtype=cache_k.dtype,
                                                       device=device)

+            new_cache_k[:] = cache_k
+            new_cache_v[:] = cache_v
+            cache_k = new_cache_k
+            cache_v = new_cache_v
+
        key_states, value_states = append_kv_cache(cache_k, cache_v, key_states, value_states)

    elif use_cache: