ayo/ipex-llm

History

Emmanuel Ferdman 68c5103a0a [NPU] Update quickstart reference (#13262 ) Fix the wrong QuickStart URLs in NPU `Save-Load/README.md`. Signed-off-by: Emmanuel Ferdman <emmanuelferdman@gmail.com>		2025-07-21 09:55:40 +08:00
..
Embedding	[NPU] Example & Quickstart updates (#12650 )	2025-01-07 13:52:41 +08:00
LLM	common.h -> npu/npu_common.h (#12800 )	2025-02-10 14:38:22 +08:00
Multimodal	[NPU] Tiny fixes on examples (#12661 )	2025-01-07 14:30:38 +08:00
Save-Load	[NPU] Update quickstart reference (#13262 )	2025-07-21 09:55:40 +08:00
README.md	[NPU] Example & Quickstart updates (#12650 )	2025-01-07 13:52:41 +08:00

README.md

IPEX-LLM Examples on Intel NPU

This folder contains examples of running IPEX-LLM on Intel NPU:

LLM: examples of running large language models using IPEX-LLM optimizations
- CPP: examples of running large language models using IPEX-LLM optimizations through C++ API
Multimodal: examples of running large multimodal models using IPEX-LLM optimizations
Embedding: examples of running embedding models using IPEX-LLM optimizations
Save-Load: examples of saving and loading low-bit models with IPEX-LLM optimizations

Tip

Please refer to IPEX-LLM NPU Quickstart regarding more information about running ipex-llm on Intel NPU.

Verified Models on Intel NPU

Model	Example Link
Llama2	Python link, C++ link
Llama3	Python link, C++ link
Llama3.2	Python link, C++ link
GLM-Edge	Python link
Qwen2	Python link, C++ link
Qwen2.5	Python link, C++ link
MiniCPM	Python link, C++ link
Baichuan2	Python link
MiniCPM-Llama3-V-2_5	Python link
MiniCPM-V-2_6	Python link
Speech_Paraformer-Large	Python link
Bce-Embedding-Base-V1	Python link