[Bad Case]: 使用LoRA微调后效果很差 #98

LiangYong1216 · 2024-03-05T02:03:40Z

LiangYong1216
Mar 5, 2024

Description / 描述

当使用你们提供的LoRA微调脚本和广告数据集进行微调后，输出效果很差（issue区大部分微调效果都不好），我不能确定是否自己写的调用代码有问题，所以请你们提供一个经过LoRA微调后的脚本，或者使用目前的广告数据集微调的话，需要修改那些参数？

Case Explaination / 案例解释

No response

Ishiki-Iroha · 2024-03-05T11:17:47Z

Ishiki-Iroha
Mar 5, 2024

我lora微调的效果还可以，下面是参数

deepspeed --include localhost:0,1,2,3,4,5,6,7 finetune.py \
    --model_name_or_path /data01/models/open_source/MiniCPM-2B-sft-fp32 \
    --output_dir /data01/models/fine_tuned/MiniCPM/cr_6b/ \
    --train_data_path /home/MiniCPM/data/cr_6b_glm.json \
    --eval_data_path /home/MiniCPM/data/cr_ori_clean_glm3/markdown_2367.json \
    --learning_rate 1e-3 --per_device_train_batch_size 2 \
    --per_device_eval_batch_size 1 --fp16 --use_lora \
    --gradient_accumulation_steps 1 --warmup_steps 100 \
    --model_max_length 5000 \
    --max_steps 8000 --weight_decay 0.01 \
    --evaluation_strategy steps --eval_steps 500 \
    --save_strategy steps --save_steps 500 --seed 42 \
    --log_level info --logging_strategy steps --logging_steps 10 \
    --deepspeed configs/ds_config_zero2.json

我就改了per_device_train_batch_size，增加了model_max_length，修改了deepspeed的配置文件，改成了zero2

0 replies

LiangYong1216 · 2024-03-05T11:21:09Z

LiangYong1216
Mar 5, 2024
Author

你用的什么数据集啊，没使用他提供的那个广告数据集吧？我用那个广告的就很差！！！

0 replies

Ishiki-Iroha · 2024-03-05T11:31:27Z

Ishiki-Iroha
Mar 5, 2024

你用的什么数据集啊，没使用他提供的那个广告数据集吧？我用那个广告的就很差！！！

我用的自己构造的下游任务数据集，没用广告的

0 replies

SwordFaith · 2024-03-06T09:28:25Z

SwordFaith
Mar 6, 2024

抱歉给您带来的不便，之前开源的代码中确实存在 bug，目前已经尝试修复，具体的性能测试还在跟进

0 replies

LiangYong1216 · 2024-03-06T09:30:07Z

LiangYong1216
Mar 6, 2024
Author

好的，有消息的话及时通知，我还是挺看好这个模型的

0 replies

xdedmyyds · 2024-03-10T06:28:50Z

xdedmyyds
Mar 10, 2024

你用的什么数据集啊，没使用他提供的那个广告数据集吧？我用那个广告的就很差！！！

我用的自己构造的下游任务数据集，没用广告的

你好，能否加一个联系方式，请教你一下微调minicpm，我也是微调下游数据集，比较急，谢谢

0 replies

Ishiki-Iroha · 2024-03-11T02:11:54Z

Ishiki-Iroha
Mar 11, 2024

你用的什么数据集啊，没使用他提供的那个广告数据集吧？我用那个广告的就很差！！！

我用的自己构造的下游任务数据集，没用广告的

你好，能否加一个联系方式，请教你一下微调minicpm，我也是微调下游数据集，比较急，谢谢

我没改过微调代码，说实话没啥经验可以交流；我这边的训练环境是8xH800 80G，包版本如下

accelerate                0.26.1
deepspeed                 0.13.1
peft                      0.7.1
torch                     2.1.2
transformers              4.39.0.dev0

0 replies

joyyang1215 · 2024-10-11T04:05:42Z

joyyang1215
Oct 11, 2024

請問dataset的數量是多少?

0 replies

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Bad Case]: 使用LoRA微调后效果很差 #98

{{title}}

Replies: 8 comments

{{title}}

{{editor}}'s edit

{{editor}}'s edit

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

{{title}}

Select a reply

[Bad Case]: 使用LoRA微调后效果很差 #98

LiangYong1216 Mar 5, 2024

Description / 描述

Case Explaination / 案例解释

Replies: 8 comments

Ishiki-Iroha Mar 5, 2024

LiangYong1216 Mar 5, 2024 Author

Ishiki-Iroha Mar 5, 2024

SwordFaith Mar 6, 2024

LiangYong1216 Mar 6, 2024 Author

xdedmyyds Mar 10, 2024

Ishiki-Iroha Mar 11, 2024

joyyang1215 Oct 11, 2024

LiangYong1216
Mar 5, 2024

Ishiki-Iroha
Mar 5, 2024

LiangYong1216
Mar 5, 2024
Author

Ishiki-Iroha
Mar 5, 2024

SwordFaith
Mar 6, 2024

LiangYong1216
Mar 6, 2024
Author

xdedmyyds
Mar 10, 2024

Ishiki-Iroha
Mar 11, 2024

joyyang1215
Oct 11, 2024