1.1.1
1.1.1版本
- 支持多卡推理,推理速度加倍,调库textgen做batch推理,多卡推理更方便、快速。
多卡数据并行,batch推理:
cd examples/gpt
CUDA_VISIBLE_DEVICES=0,1 torchrun --nproc_per_node 2 inference_multigpu_demo.py --model_type chatglm --base_model THUDM/chatglm-6b
- 优化ChatGLM-6B/Baichuan/LLaMA2/BLOOM的多轮对话SFT代码,逻辑合并到textgen/gpt下,统一处理多模型微调,加入prompt模板支持。
Full Changelog: 1.1.0...1.1.1