Refine param conversion logic in layer.to #36862

zhangbo9674 · 2021-10-29T09:45:49Z

PR types

Performance optimization

PR changes

APIs

Describe

Class Layer的layer.to()用于将网络参数做device或dtype的转换。

1、原始数据处理逻辑：
（1）遍历Layer的参数、梯度、buffer；
（2）拷贝到指定device：new_t = t._copy_to(device, blocking)；
（3）数据类型转换：new_t = new_t.cast(dtype=dtype)；
（4）返回new_t；

2、存在的问题及需求：
在fp16训练模式下，通过layer.to方法将网络参数从fp32转为fp16，利用上述逻辑在第(3)步的阶段，显存会同时持有fp32和fp16两份参数，导致显存增长。

3、修改后的逻辑：
以float32网络通过layer.to(‘float16’)将参数转为float16为例：
（1）判断显存是否足够再创建一个参数；
（2）如果显存充足，则直接将数据cast为float16。
（3）如果显存不够，则将参数拷贝到cpu并释放gpu持有的tensor，在cpu将数据cast为float16，最后将转换后的数据转回gpu；
程序运行流程图如下图所示：

… dev/refine_layerto_new

zhiqiu · 2021-11-08T12:17:23Z

python/paddle/fluid/dygraph/layers.py

+                else:
+                    size_dtype = core.size_of_dtype(dtype)
+                waiting_alloc_memory = (
+                    (t.numel().numpy()[0] * size_dtype) / 256 + 1) * 256 * 1.2


Add comments on this.

Done, thanks!

zhiqiu · 2021-11-08T12:17:36Z

python/paddle/fluid/dygraph/layers.py

@@ -121,8 +121,8 @@ def __init__(self, name_scope=None, dtype="float32"):
        self._forward_pre_hooks = collections.OrderedDict()
        self._forward_post_hooks = collections.OrderedDict()

-        self._parameters_transform_map = {}
-        self._buffers_transform_map = {}
+        #self._parameters_transform_map = {}


Remove unused code.

Done, thanks!

zhiqiu

LGTM

* refine layer to * delete comment * refine logic * refine code * refine pure_fp16_init * refine comment

优化layer.to实现逻辑，相关pr： Remove additional warnning in layer.to ( #36700) Refine param conversion logic in layer.to ( #36862) Fix Layer.to() of device bug ( #37156)

zhangbo9674 added 2 commits October 29, 2021 09:31

refine layer to

f78f2ec

delete comment

e59ff69

zhangbo9674 changed the title ~~Dev/refine layerto new~~ Set layer.to inplace Oct 29, 2021

zhangbo9674 changed the title ~~Set layer.to inplace~~ Refine param conversion logic in layer.to Oct 29, 2021

zhangbo9674 added 4 commits November 1, 2021 04:02

Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

e25e563

… dev/refine_layerto_new

refine logic

cdc8349

refine code

2d7f83f

refine pure_fp16_init

c50d589

zhiqiu reviewed Nov 8, 2021

View reviewed changes

refine comment

b6a965b

zhiqiu self-requested a review November 9, 2021 07:07

zhiqiu approved these changes Nov 9, 2021

View reviewed changes

zhiqiu merged commit 993ec76 into PaddlePaddle:develop Nov 9, 2021

zhangbo9674 mentioned this pull request Nov 12, 2021

Fix Layer.to() of device bug #37156

Merged

MingMingShangTian mentioned this pull request Dec 9, 2021

layer.to api support numpy.dtype and paddle.dtype #38018

Merged

zhangbo9674 added a commit to zhangbo9674/Paddle that referenced this pull request Dec 12, 2021

Refine param conversion logic in layer.to (PaddlePaddle#36862)

c4df875

* refine layer to * delete comment * refine logic * refine code * refine pure_fp16_init * refine comment

zhangbo9674 mentioned this pull request Dec 12, 2021

[cherry pick] Refine param conversion logic in layer.to #38058

Closed

zhangbo9674 added a commit to zhangbo9674/Paddle that referenced this pull request Dec 12, 2021

Refine param conversion logic in layer.to (PaddlePaddle#36862)

8e8aba2

* refine layer to * delete comment * refine logic * refine code * refine pure_fp16_init * refine comment

zhangbo9674 added a commit to zhangbo9674/Paddle that referenced this pull request Dec 13, 2021

Refine param conversion logic in layer.to (PaddlePaddle#36862)

1be770f

* refine layer to * delete comment * refine logic * refine code * refine pure_fp16_init * refine comment

zhangbo9674 mentioned this pull request Dec 13, 2021

[cherry pick] Refine param conversion logic in layer.to #38068

Merged

zhangbo9674 deleted the dev/refine_layerto_new branch March 2, 2023 02:57

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Refine param conversion logic in layer.to #36862

Refine param conversion logic in layer.to #36862

zhangbo9674 commented Oct 29, 2021 •

edited

Loading

zhiqiu Nov 8, 2021

zhangbo9674 Nov 8, 2021

zhiqiu Nov 8, 2021

zhangbo9674 Nov 8, 2021

zhiqiu left a comment

Refine param conversion logic in layer.to #36862

Refine param conversion logic in layer.to #36862

Conversation

zhangbo9674 commented Oct 29, 2021 • edited Loading

PR types

PR changes

Describe

zhiqiu Nov 8, 2021

Choose a reason for hiding this comment

zhangbo9674 Nov 8, 2021

Choose a reason for hiding this comment

zhiqiu Nov 8, 2021

Choose a reason for hiding this comment

zhangbo9674 Nov 8, 2021

Choose a reason for hiding this comment

zhiqiu left a comment

Choose a reason for hiding this comment

zhangbo9674 commented Oct 29, 2021 •

edited

Loading