[Bug] make `ZeroRedundancyOptimizer` support param-wise settings #716

nijkah · 2022-11-11T04:50:11Z

nijkah
Nov 11, 2022

Some configurations such as mask-rcnn_swin-t-p4-w7_fpn_1x_coco.py requires paramwise_cfg to give different parameters to some modules.

However, torch.distributed.optim.ZeroRedundancyOptimizer only recently started supporting the feature for multiple param groups. (Link)
(It supports in torch.__version__ >= 1.12.0).

The key implementation is

Save parameters as List[torch.Tensor] in ZeroRedundancyOptimizer._all_params
Give original parameters to the inner optimizer(optimizer_class) as Optimizer.__init__(self, params, defaults)

We can copy-and-paste its __init__ logic to support param-wise settings with torch.__version__ < 1.12.0.
However, I think this kind of solution is quite messy and vulnerable to change in torch.distributed.optim.ZeroRedundancyOptimizer.

I kindly ask for any good ideas to handle this!

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

[Bug] make `ZeroRedundancyOptimizer` support param-wise settings #716

{{title}}

{{editor}}'s edit

{{editor}}'s edit

Replies: 0 comments

Select a reply

[Bug] make ZeroRedundancyOptimizer support param-wise settings #716

nijkah Nov 11, 2022

Replies: 0 comments

[Bug] make `ZeroRedundancyOptimizer` support param-wise settings #716

nijkah
Nov 11, 2022