推理性能 | GGUF格式(C++) | HF格式(Python) | 加速比 |
---|---|---|---|
9.34 tokens/s | 1.21 tokens/s | 7.72 | |
内存占用 | GGUF格式(C++) | HF格式(Python) | 内存比(GGUF/HF) |
~0.4 GB | ~8.6 GB | 4.65% |
- 可使用内存:400MB以上
- 系统: windows10/11 64位
链接:https://pan.baidu.com/s/1fVWKNL-GQum4PCsU8YNruQ?pwd=qq4g
本版本只适用于
gguf
格式模型。
YuanChat.exe
占用本地的5050
端口,如果系统中有其他应用占用了此端口会导致YuanChat.exe
启动失败,请使用前确认系统环境。
YuanChat.exe
支持两种方式对模型进行加载: 本地模型 和 在线加载(ModelScope)
如果是第一次运行YuanChat.exe
,且没有下载过Yuan2-2B
的gguf
模型,可以选择ModelScope
方式进行模型的下载。
Yuan2-2B
的gguf
模型在ModelScope
的路径为:模型地址链接。
打开链接后,点击复制按钮复制模型地址。
复制模型地址到输入框,并填写一个本地目录用于保存模型(下一次启动不用再次下载)
待模型下载完成后,会自动加载,加载完成后即可开始使用
此种方式适用于本地已有下载的模型,复制模型所在目录地址,及模型文件的文件名称,即复制模型文件全路径信息,填写到页面中
如果在使用程序过程中有任何问题,欢迎在本项目的issue
中进行提问