ipex-llm

History

SONG Ge fa47967583 [LLM] Optimize kv_cache for gptj model family (#9010 ) * optimize gptj model family attention * add license and comment for dolly-model * remove xpu mentioned * remove useless info * code sytle * style fix * code style in gptj fix * remove gptj arch * move apply_rotary_pos_emb into utils * kv_seq_length update * use hidden_states instead of query layer to reach batch size	2023-09-21 10:42:08 +08:00
..
llm	[LLM] Optimize kv_cache for gptj model family (#9010 )	2023-09-21 10:42:08 +08:00

SONG Ge fa47967583 [LLM] Optimize kv_cache for gptj model family (#9010 )

* optimize gptj model family attention

* add license and comment for dolly-model

* remove xpu mentioned

* remove useless info

* code sytle

* style fix

* code style in gptj fix

* remove gptj arch

* move apply_rotary_pos_emb into utils

* kv_seq_length update

* use hidden_states instead of query layer to reach batch size

2023-09-21 10:42:08 +08:00

llm

[LLM] Optimize kv_cache for gptj model family (#9010 )

2023-09-21 10:42:08 +08:00