MiniCPM_Series Cookbook

This repository is a guide for the MiniCPM series of edge-side models, covering inference, quantization, edge-end deployment, fine-tuning, applications, and technical reports.

MiniCPM Repository | MiniCPM-V Repository | MiniCPM Series Knowledge Base | 中文教程 | Join our Discord and WeChat Group

The MiniCPM edge-side series is jointly open-sourced by ModelBest and OpenBMB, in collaboration with the Tsinghua NLP Lab. It comprises globally lightweight high-performance AI models，including the MiniCPM foundation model and the MiniCPM-V multimodal model. We have now ushered in the "Edge-Side ChatGPT Era" in terms of performance; in the multimodal direction, we have made GPT-4V level MLLMsfor Single Image, Multi Image and Video on Your Phone. It is currently being deployed in end devices such as smartphones, computers, cars, wearable devices, VR, and more. For more detailed information about the MiniCPM series, please visit the OpenBMB page.

Applications (✅)

Language Models

Playing with RAG LangChain on 4GB VRAM
Controllable Text Generation with RLHF
Function Call
Build Your Agent Data
Building an Agent on AIPC-Windows

Multimodal Models

Cross-Modality High-Definition Retrieval
Text Recognition and Localization
Getting Started with Agents
Constructing Long-Chain Agents
Multimodal Document RAG

Technical Reports (✅)

MiniCPM Language Model Technical Report
MiniCPM-V Multimodal Model Technical Report
Evolution of Attention Mechanisms in MiniCPM
Architecture Principles of MiniCPM-V Multimodal Model
Principles of High-Definition Decoding in MiniCPM-V

Supported Hardware (Cloud and Edge) (✅)

GPU
CPU
NPU
Android
Mac
Windows
iOS

Model Addresses and Downloads (Partial) (✅)

MiniCPM 2.4B
MiniCPM-V
MiniCPM-V 2.0
MiniCPM-Llama3-V 2.5
MiniCPM-V 2.6
MiniCPM 3.0 4B

Inference Deployment (✅)

MiniCPM 2.4B

MiniCPM 2.4B_transformers_cuda
MiniCPM 2.4B_vllm_cuda
MiniCPM 2.4B__mlx_mac
MiniCPM 2.4B_ollama_cuda_cpu_mac
MiniCPM 2.4B_llamacpp_cuda_cpu
MiniCPM 2.4B_llamacpp_android

MiniCPM-S 1.2B

MiniCPM-S 1.2B_powerinfer_cuda
MiniCPM-S 1.2B_powerinfer_android

MiniCPM 3.0

MiniCPM 3.0_vllm_cuda
MiniCPM 3.0_transformers_cuda_cpu
MiniCPM 3.0_llamacpp_cuda_cpu
MiniCPM 3.0_sglang_cuda

MiniCPM-Llama3-V 2.5

MiniCPM-Llama3-V 2.5_vllm_cuda
MiniCPM-Llama3-V 2.5_LMdeploy_cuda
MiniCPM-Llama3-V 2.5_llamacpp_cuda_cpu
MiniCPM-Llama3-V 2.5_ollama_cuda_cpu
MiniCPM-Llama3-V 2.5_transformers_cuda
MiniCPM-Llama3-V 2.5_xinference_cuda
MiniCPM-Llama3-V 2.5_swift_cuda

MiniCPM-V 2.6

MiniCPM-V 2.6_vllm_cuda
MiniCPM-V 2.6_vllm_api_server_cuda
MiniCPM-V 2.6_llamacpp_cuda_cpu
MiniCPM-V 2.6_transformers_cuda
MiniCPM-V 2.6_swift_cuda

Fine-Tuning (✅)

MiniCPM 3.0

MiniCPM2.0_official_code_sft_cuda
MiniCPM3_llamafactory_sft_RLHF_cuda

MiniCPM 2.4B

MiniCPM2.0_official_code_sft_cuda
MiniCPM2.0_mlx_sft_lora_mac
MiniCPM2.0_llamafactory_RLHF_cuda

MiniCPM-Llama3-V 2.5

MiniCPM-Llama3-V 2.5 Official Code CUDA
MiniCPM-Llama3-V-2_5 Swift CUDA
Hybrid Modality Training

MiniCPM-V 2.6

MiniCPM-V 2.6 Official Code SFT CUDA
MiniCPM-V 2.6 Swift SFT CUDA
Hybrid Modality Training

Model Quantization (✅)

MiniCPM 2.4B

MiniCPM 2.4B AWQ Quantization
MiniCPM 2.4B GGUF Quantization
MiniCPM 2.4B GPTQ Quantization
MiniCPM 2.4B BNB Quantization

MiniCPM 3.0

MiniCPM 3.0 AWQ Quantization
MiniCPM 3.0 GGUF Quantization
MiniCPM 3.0 GPTQ Quantization
MiniCPM 3.0 BNB Quantization

MiniCPM-Llama3-V 2.5

MiniCPM-Llama3-V 2.5 BNB Quantization
MiniCPM-Llama3-V 2.5 GGUF Quantization

MiniCPM-V 2.6

MiniCPM-V 2.6 BNB Quantization
MiniCPM-V 2.6 AWQ Quantization
MiniCPM-V 2.6 GGUF Quantization

Integration (✅)

LangChain
OpenAI API

Open Source Community Collaboration (✅)

xtuner: The Optimal Choice for Efficient Fine-Tuning of MiniCPM
LLaMA-Factory: One-Click Fine-Tuning Solution for MiniCPM
ChatLLM Framework: Running MiniCPM on CPU
datawhale_Rapidly deploy open source large models based on Linux environment

Community Contributions

In the spirit of open source, we encourage contributions to this repository, including but not limited to adding new MiniCPM tutorials, sharing user experiences, providing ecosystem compatibility, and model applications. We look forward to contributions from developers to enhance our open-source repository.

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README_en.md

README_en.md

MiniCPM_Series Cookbook

Table of Contents

About MiniCPM (✅)

Applications (✅)

Language Models

Multimodal Models

Technical Reports (✅)

Supported Hardware (Cloud and Edge) (✅)

Model Addresses and Downloads (Partial) (✅)

Inference Deployment (✅)

MiniCPM 2.4B

MiniCPM-S 1.2B

MiniCPM 3.0

MiniCPM-Llama3-V 2.5

MiniCPM-V 2.6

Fine-Tuning (✅)

MiniCPM 3.0

MiniCPM 2.4B

MiniCPM-Llama3-V 2.5

MiniCPM-V 2.6

Model Quantization (✅)

MiniCPM 2.4B

MiniCPM 3.0

MiniCPM-Llama3-V 2.5

MiniCPM-V 2.6

Integration (✅)

Open Source Community Collaboration (✅)

Community Contributions

Files

README_en.md

Latest commit

History

README_en.md

File metadata and controls

MiniCPM_Series Cookbook

Table of Contents

About MiniCPM (✅)

Applications (✅)

Language Models

Multimodal Models

Technical Reports (✅)

Supported Hardware (Cloud and Edge) (✅)

Model Addresses and Downloads (Partial) (✅)

Inference Deployment (✅)

MiniCPM 2.4B

MiniCPM-S 1.2B

MiniCPM 3.0

MiniCPM-Llama3-V 2.5

MiniCPM-V 2.6

Fine-Tuning (✅)

MiniCPM 3.0

MiniCPM 2.4B

MiniCPM-Llama3-V 2.5

MiniCPM-V 2.6

Model Quantization (✅)

MiniCPM 2.4B

MiniCPM 3.0

MiniCPM-Llama3-V 2.5

MiniCPM-V 2.6

Integration (✅)

Open Source Community Collaboration (✅)

Community Contributions