how deepspeed can avoid doing all_reduce? #6690

luuck · 2024-10-30T13:03:48Z

I set something in DeepSpeed in order to bypass being all-reduced on all model parameters.

In order words, below is exactly the parameter list I need to bypass doing allreduce:
bypass_list = [x for x in model.parameters() if getattr(param, '_tutel_expert', False) == True]

how DeepSpeed can avoid doing all_reduce for bypass_list above?

jomayeri · 2024-11-14T19:04:19Z

There is an outstanding PR that may be of use: #6675

jomayeri self-assigned this Nov 14, 2024

jomayeri closed this as completed Dec 6, 2024

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

how deepspeed can avoid doing all_reduce? #6690

how deepspeed can avoid doing all_reduce? #6690

luuck commented Oct 30, 2024

jomayeri commented Nov 14, 2024

how deepspeed can avoid doing all_reduce? #6690

how deepspeed can avoid doing all_reduce? #6690

Comments

luuck commented Oct 30, 2024

jomayeri commented Nov 14, 2024