ipex-llm

History

Cengguang Zhang 39d90839aa LLM: add quantize kv cache for llama. (#10086 ) * feat: add quantize kv cache for llama. * fix style. * add quantized attention forward function. * revert style. * fix style. * fix style. * update quantized kv cache and add quantize_qkv * fix style. * fix style. * optimize quantize kv cache. * fix style.	2024-02-08 16:49:22 +08:00
..
llm	LLM: add quantize kv cache for llama. (#10086 )	2024-02-08 16:49:22 +08:00

Cengguang Zhang 39d90839aa LLM: add quantize kv cache for llama. (#10086 )

* feat: add quantize kv cache for llama.

* fix style.

* add quantized attention forward function.

* revert style.

* fix style.

* fix style.

* update quantized kv cache and add quantize_qkv

* fix style.

* fix style.

* optimize quantize kv cache.

* fix style.

2024-02-08 16:49:22 +08:00

llm

LLM: add quantize kv cache for llama. (#10086 )

2024-02-08 16:49:22 +08:00