[LLM] Fix Qwen registered_causal_mask is None (#9513)

* Add registered_causal_mask init based on 2abd8e5777.
2023-11-23 09:28:04 +08:00 · 2023-11-23 09:28:04 +08:00 · 0f0c6bb631
commit 0f0c6bb631
parent 11fa5a8a0e
1 changed files with 3 additions and 0 deletions
--- a/python/llm/src/bigdl/llm/transformers/models/qwen.py
+++ b/python/llm/src/bigdl/llm/transformers/models/qwen.py
@ -174,6 +174,9 @@ def qwen_attention_forward(
        context_layer = context_layer.flatten(2, 3).contiguous()
    else:
        registered_causal_mask = torch.tril(
            torch.ones((key.size(1), key.size(1)), dtype=torch.bool, device=key.device)
        ).view(1, 1, key.size(1), key.size(1))
        query = query.permute(0, 2, 1, 3)
        if not self.use_cache_quantization:
            key = key.permute(0, 2, 1, 3)