Skip to content

QuickStartSakuraLLM

neavo edited this page Dec 8, 2024 · 1 revision

要求

  • 至少 8G 显存的 Nvidia 独立显卡
  • 确保安装了 最新版本 的显卡驱动程序

步骤

  • 发布页 下载最新版本的 SakuraLLMServer 并解压缩
  • 根据显存大小下载适合的模型并放入 SakuraLLMServer 文件夹
显存大小 模型规模 下载链接
8G/10G 7B sakura-7b-qwen2.5-v1.0-iq4xs.gguf
11G/12G/16G 14B sakura-14b-qwen2.5-v1.0-iq4xs.gguf
24G 14B sakura-14b-qwen2.5-v1.0-q6k.gguf

启动

  • 现在你的文件结构应该类似于:
  SakuraLLMServer\llama\...
                    \00_Core.bat
                    \01_1280_NP16.bat
                    \sakura-14b-qwen2.5-v1.0-iq4xs.gguf
                    \...
  • 根据 你的显存和模型的搭配组合 选择对应的启动脚本,双击启动即可
显存大小 模型规模 启动脚本
8G/10G 7B 01_1280_NP16.bat
11G 14B 01_1280_NP4.bat
12G 14B 01_1280_NP6.bat
16G/24G 14B 01_1280_NP16.bat

设置 AiNiee

  • 确保安装了 最新版本(版本号 >= 5.2)AiNiee 应用
  • 启动应用,设置以下选项,其余设置保持默认即可::
选项 设置
接口管理 - SakuraLLM - 编辑接口 - 接口地址 http://127.0.0.1:8080
接口管理 - SakuraLLM - 编辑接口 - 模型名称 Sakura-v1.0
项目设置 - 接口名称 SakuraLLM
基础设置 - 翻译任务切分模式 Token 模式
基础设置 - 翻译任务的最大 Tokens 数 384
基础设置 - 每个翻译任务携带的参考上文行数(翻译 小说 时) 3
基础设置 - 每个翻译任务携带的参考上文行数(翻译 其他内容 时) 0
基础设置 - 同时执行的翻译任务数量 启动脚本名称中 NP 后的数字
基础设置 - 翻译流程的最大轮次 20
高级设置 - 保留句内换行符 启用
高级设置 - 保留首尾代码段 启用

开始翻译

  • 将要翻译的文本放入 输入文件夹(默认为应用目录内的 input 文件夹)
  • 根据实际情况对 项目设置 页面的各项信息进行设置
  • 开始翻译
  • 翻译进度将在 控制台(黑色文本窗口)开始翻译 页面上更新
  • 翻译结果将在翻译完成后保存到 输出文件夹(默认为应用目录内的 output 文件夹)
Clone this wiki locally