feat(loss)/add different operator types for cross_entropy #386

yingtongxiong · 2024-12-04T09:17:14Z

Motivation

support different operator types for cross_entropy
add op_type config
loss = dict( label_smoothing=0, op_type="flash_vocab_parallel", )

If this PR introduces a new feature, it is better to list some use cases here and update the documentation.

Before PR:

sunpengsdu · 2024-12-17T07:03:39Z

@yingtongxiong merge下develop分支过CI吧

yingtongxiong · 2024-12-17T07:06:05Z

@yingtongxiong merge下develop分支过CI吧

好的

merge develop

yingtongxiong · 2024-12-17T09:14:44Z

@yingtongxiong merge下develop分支过CI吧

@sunpengsdu 已经好了

merge develop

yingtongxiong added 3 commits December 4, 2024 16:06

add cross_entropy operators

9869829

support different types of cross_entropy

6d22492

fix lint

489125f

mm-assistant bot assigned sunpengsdu Dec 4, 2024

yingtongxiong added 2 commits December 4, 2024 17:21

remove gpc in ce_loss.py

a76fc1f

fix CI

62e4d78

Merge branch 'develop' into feat/loss_func

660a25f

merge develop

Merge branch 'develop' into feat/loss_func

7274619

merge develop

sunpengsdu approved these changes Dec 17, 2024

View reviewed changes

sunpengsdu merged commit 141e9eb into InternLM:develop Dec 17, 2024
25 checks passed