ipex-llm

History

Xiangyu Tian 531bef2810 vLLM: Fix conver_to_half condition (#13177 ) * fix * format		2025-05-22 15:44:10 +08:00
..
cli	Refactor bigdl.llm to ipex_llm (#24 )	2024-03-22 15:41:21 +08:00
ggml	LLM: add new qtype woq_int4 to support gemm int4 temporary. (#12706 )	2025-01-15 14:41:33 +08:00
gptq	Refactor bigdl.llm to ipex_llm (#24 )	2024-03-22 15:41:21 +08:00
langchain	Remove chatglm_C Module to Eliminate LGPL Dependency (#11178 )	2024-05-31 17:03:11 +08:00
llamaindex	Llamaindex: add tokenizer_id and support chat (#10590 )	2024-04-07 13:51:34 +08:00
serving	Resolve messages formatting issues (#13095 )	2025-05-15 16:46:52 +08:00
transformers	vLLM: Fix conver_to_half condition (#13177 )	2025-05-22 15:44:10 +08:00
utils	Resolve messages formatting issues (#13095 )	2025-05-15 16:46:52 +08:00
vllm	Fix multimodal errors (#13178 )	2025-05-22 15:39:27 +08:00
__init__.py	IPEX Duplicate importer V2 (#11310 )	2024-06-19 16:29:19 +08:00
convert_model.py	Refactor bigdl.llm to ipex_llm (#24 )	2024-03-22 15:41:21 +08:00
format.sh	Refactor bigdl.llm to ipex_llm (#24 )	2024-03-22 15:41:21 +08:00
llm_patching.py	Upgrade Peft version to 0.10.0 for LLM finetune (#10886 )	2024-05-07 15:09:14 +08:00
models.py	Remove chatglm_C Module to Eliminate LGPL Dependency (#11178 )	2024-05-31 17:03:11 +08:00
optimize.py	initial implementation for low_bit_loader vLLM (#12838 )	2025-02-19 19:45:34 +08:00