Skip to content

Latest commit

 

History

History
8 lines (7 loc) · 315 Bytes

MultiGPU.md

File metadata and controls

8 lines (7 loc) · 315 Bytes

多卡并行

rtp-llm支持单机多卡并行

单机多卡

单机多卡并行配置非常简单,只需在启动服务时添加环境变量TP_SIZE, WORLD_SIZE,请求服务则和单卡时的逻辑一致,参考命令如下:

TP_SIZE=2 WORLD_SIZE=2 python3 -m maga_transformer.start_server