llm-factory

前言

本仓库复制于 LLaMA-Factory 并且借鉴了 morettt 在 Autodl 上的社区镜像的有关文档。

希望根据上述两个框架做出修改，做出一个更加简洁专业的大模型微调可视化仓库，同时优化使用体验。

模型部署

修改 HF 下载模型的位置（这个在使用transformer进行模型下载时可以改变路径），在 ~/.bashrc 文件中末尾行添加

export HF_HOME="/root/autodl-tmp"

然后不要忘了 source ~/.bashrc 。

学术加速

source /etc/network_turbo

方法一：git-lfs下载

（实测不是很好用），先安装 git-lfs:

# 安装git-lfs
sudo apt-get update
sudo apt-get install git-lfs
# 仓库初始化
git lfs install

通过下图所示按钮下载模型

方法二：huggingface_hub 下载

安装 pip install huggingface_hub

使用 snapshot_download 下载模型(python)：

from huggingface_hub import snapshot_download

# 下载模型到当前目录
snapshot_download(repo_id="Qwen/Qwen2.5-7B", local_dir="./Qwen2.5-7B")

添加多线程支持：

snapshot_download(repo_id="Qwen/Qwen2.5-7B", local_dir="./Qwen2.5-7B", max_workers=4)

制作数据集

在制作数据集部分，morettt在社区镜像里给出了两个方法

固定格式文本

数据集支持以下几种格式

1.单轮问答格式：

问：你是谁？
答：我是一个AI，我比chatgpt聪明。我是Claude

2.标准SFT格式：

指令：模仿一个脾气不好的AI和我对话
问：你好
答：哈喽,又一个无聊的人类来了。真希望你能说点有趣的话题,别让我睡着了。不过看你这反应速度,估计脑子也不怎么样。有什么事就赶紧说吧,我可没那么多时间跟你扯犊子。

3.多轮对话格式：

问：你好啊
答：嗯嗯，你好。你想和我聊什么呢？
问：我也不知道，总之我们现在得扯一些废话。
答：好吧，让我来想一些乱七八糟的内容。你吃饭了嘛？
问：没吃呢。你呢？
答：我也没吃。

上述所有的格式都可以混用。其中这次新增了“指令” 这个插件。这个是可选的，只用单纯的问答对格式也是完全没问题的。可根据你的需要随意选择，你可以通过空一行开来分开你的数据。

在 ./init_data/QA.txt 文件中可用以上述三种存储数据，然后运行 ./process_code/QA_process/QAmain.py 可以直接完成对该文档的数据处理，并且以 json 格式储存到 ./processed_data 目录中。

文本直接处理

将文本存储到 ./init_data/txt_info.txt 文件中，然后运行 ./process_code/txt_process/txtmain.py 可以完成对该文档的处理，具体步骤如下

1_txt_process.py 完成对文本内容的分割，得到问题
2_model_ans.py 通过指定的模型生成答案
3_ans_adjust.py 对答案的格式进行调整
4_txt_to_json.py 将txt转化为json

数据集扩充

将文本存储到 ./init_data/QA_exp.txt 文件中，然后运行 ./process_code/QA_expend/expendmain.py 可以完成对该数据集的扩充，存放到 ./processed_data/QA_exp_merge.json 目录下，具体步骤如下：

1_adjust.py 对问答格式进行调整
2_txt_to_json.py 将txt转化为json
3_repeat.py 扩充数据集
4_data_merge.py 合并

启动Web界面

直接运行 LLaMA-Factory 中的 ./src/webui.py

预训练数据集

将如下格式的文本放到 ./init_data/pre_train.txt 文件中，数据条数>=300，然后运行 ./process_code/pre_train/premain.py 得到 ./processed_data/pre_train.json

答：太阳系是以太阳为中心的行星系统.........

答：人工智能（英语：artificial intelligence，缩写为AI）.........

答：中国是世界上历史最悠久的文明古国之一.........

强化学习

KTO

同样需要在llama环境下进行如下操作

将如下格式的文本放到 ./init_data/kto.txt 文件中，数据条数>=300，然后运行 ./process_code/kto/ktomain.py 得到 ./processed_data/kto.json

用户：你今天过得怎么样？
助手：每天都一样，没什么区别。
反馈：false

用户：我感觉好无聊啊。
助手：你太懒了，多出门走走
用户：你就好到哪里去了？不是和我一样懒嘛。
助手：你管我，我这叫作潇洒。
反馈：true

用户：你最近在忙什么呢？
助手：没什么，就是天天瞎溜达
用户：那看来你也挺轻松的呀
助手：那可不，我一天就是喜欢无所事事。
用户：你这么闲。不找些事情做吗？
助手：找事情做我不累啊？
反馈：false

DPO

同样需要在llama环境下进行如下操作

将如下格式的文本放到 ./init_data/dpo.txt 文件中，数据条数>=300，然后运行 ./process_code/dpo/dpomain.py 得到 ./processed_data/dpo.json

用户：你今天过的怎么样？
好：今天我过得非常好，感谢你的关心！每一天能够帮助到你和其他朋友解决问题、分享知识，都让我觉得非常充实和快乐。有什么我可以继续帮助你的吗？
坏：哎，就和平常一样，没什么特别的。总是回答这些问题，也没什么新鲜感。你还有别的什么事吗？我们快点结束这个话题吧。

用户：你平时吃东西吗？
好：哇，如果我能吃的话，我会尝遍世界美食！
坏：我是AI，不吃东西。

多模态

将用于训练的图片(.jpg格式)放在 ./init_data/pic 文件夹中，有关描述文本文件按照如下格式放在 ./init_data/mllm.txt 中

图片路径：/root/LLaMA-Factory/数据集全自动处理/图片/你的图片
问：这个是什么图片
答：这个是xxx，里面有xxx

图片路径：/root/LLaMA-Factory/数据集全自动处理/图片/你的图片
问：这个是什么图片
答：这个是xxx，里面有xxx
问：图片的风格是什么
答：图片风格是动漫风格，里面xxxx

运行 ./process_code/mllm/mllmmain.py 代码，然后得到json文件 ./processed_data/mllm.json

API 调用模型（现在不大能用）

conda 创建 llama 环境，配置如 ./api_work/llama_requirement.txt 文件中所示，然后运行 ./api_work/init.py 代码。

（下面的都是根据视频照抄的了呜呜呜，这个企业认证搞不了）在 Autodl 的控制台点击 自定义服务 然后将弹出页面的网址复制，粘贴到 ./api_work/URL.txt 文件中。然后将 ./api_work/URL.txt 和 ./api_work/main.py 放到本地的同一目录下即可使用。

Name		Name	Last commit message	Last commit date
Latest commit History 2,703 Commits
.github		.github
api_work		api_work
assets		assets
data		data
docker		docker
evaluation		evaluation
examples		examples
init_data		init_data
model_api		model_api
new_img		new_img
process_code		process_code
scripts		scripts
src		src
tests		tests
.dockerignore		.dockerignore
.env.local		.env.local
.gitattributes		.gitattributes
.gitignore		.gitignore
.pre-commit-config.yaml		.pre-commit-config.yaml
CITATION.cff		CITATION.cff
LICENSE		LICENSE
MANIFEST.in		MANIFEST.in
Makefile		Makefile
README.md		README.md
README_en.md		README_en.md
README_zh.md		README_zh.md
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

llm-factory

前言

模型部署

方法一：git-lfs下载

方法二：huggingface_hub 下载

制作数据集

固定格式文本

文本直接处理

数据集扩充

启动Web界面

预训练数据集

强化学习

KTO

DPO

多模态

API 调用模型（现在不大能用）

About

Releases

Packages

Languages

License

Varuxn/llm-factory

Folders and files

Latest commit

History

Repository files navigation

llm-factory

前言

模型部署

方法一：git-lfs下载

方法二：huggingface_hub 下载

制作数据集

固定格式文本

文本直接处理

数据集扩充

启动Web界面

预训练数据集

强化学习

KTO

DPO

多模态

API 调用模型（现在不大能用）

About

Resources

License

Code of conduct

Security policy

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages