ipex-llm

History

Jun Wang 1efb6ebe93 [ADD] add `transformer_int4_fp16_loadlowbit_gpu_win` api (#11511 ) * [ADD] add transformer_int4_fp16_loadlowbit_gpu_win api * [UPDATE] add int4_fp16_lowbit config and description * [FIX] fix run.py mistake * [FIX] fix run.py mistake * [FIX] fix indent; change dtype=float16 to model.half()	2024-07-05 16:38:41 +08:00
..
llm	[ADD] add `transformer_int4_fp16_loadlowbit_gpu_win` api (#11511 )	2024-07-05 16:38:41 +08:00

[ADD] add transformer_int4_fp16_loadlowbit_gpu_win api (#11511 )

* [ADD] add transformer_int4_fp16_loadlowbit_gpu_win api

* [UPDATE] add int4_fp16_lowbit config and description

* [FIX] fix run.py mistake

* [FIX] fix run.py mistake

* [FIX] fix indent; change dtype=float16 to model.half()

2024-07-05 16:38:41 +08:00

llm [ADD] add transformer_int4_fp16_loadlowbit_gpu_win api (#11511 ) 2024-07-05 16:38:41 +08:00