Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad #38959

AnnaTrainingG · 2022-01-14T11:38:14Z

PR types

Performance optimization

PR changes

OPs

Describe

Reduce EigenBroadcastcase with ElementwiseBroadcast in ReduceGrad
为扩大KP算子覆盖率，统一将Reduce_sum/mean 反向的Eigen适配代码替换为ElementwiseBroadcast Kernel
ReduceGrad 性能统计对比：

op name	case	axise	dtype	优化前（us)	优化后（us)	speed up
reduce_sum_grad	[-1L, 2048L, 33L, 33L]	[2,3]	float32	626	160.73	3.89
reduce_sum_grad	[-1L, 2048L, 33L, 33L]	[2,3]	float16	633	83.64	7.57
reduce_sum_grad	[-1L, 8L, 128L]	[1]	float32	2.44	1.71	1.43
reduce_sum_grad	[-1L, 8L, 128L]	[1]	float16	2.84	1.7	1.67
reduce_sum_grad	[30522L, 1024L]	[]	float32	150.38	138.79	1.08
reduce_sum_grad	[30522L, 1024L]	[]	float16	89.81	43.44	2.07
op name	case	axise	dtype	优化前（us)	优化后（us)	speed up
reduce_mean_grad	[-1L, 2048L, 33L, 33L]	[2,3]	float32	672	160.71	4.18
reduce_mean_grad	[-1L, 2048L, 33L, 33L]	[2,3]	float16	681	83.1	8.19
reduce_mean_grad	[-1L, 8L, 128L]	[1]	float32	3.115	1.72	1.81
reduce_mean_grad	[-1L, 8L, 128L]	[1]	float16	3.171	1.66	1.91
reduce_mean_grad	[30522L, 1024L]	[]	float32	152.78	138.83	1.10
reduce_mean_grad	[30522L, 1024L]	[]	float16	134.96	69.835	1.93

benchmark 异常说明，与本次PR修改无关，本地测试无性能影响：

op name	shape	dtype	dev (us)	new (us)	speed up
p_norm_1 backward	[300, 128, 128], axis = -1 porder = 3.0	float32	178.26	178.06	1.00112322
matmul_3_backward	[paddle][p_norm] p_norm { run_tf: True run_torch: True axis: -1 porder: 3.0 keepdim: False x_shape: [300, 128, 128] x_dtype: float32 atol: 1e-06 [paddle][p_norm] p_norm { run_tf: True run_torch: True axis: -1 porder: 3.0 keepdim: False x_shape: [300, 128, 128] x_dtype: float32 atol: 1e-06	float32	12.7867	12.865	0.99391372
matmul_9_forward	[paddle][matmul] matmul { run_tf: True run_torch: True atol: 1.0 transpose_x: False transpose_y: False x_shape: [4, 12, 64, 85] x_dtype: float16 y_shape: [4, 12, 85, 512] y_dtype: float16 }	float32	26.165	26.146	1.00072669

paddle-bot-old · 2022-01-14T11:38:19Z

Thanks for your contribution!
Please wait for the result of CI firstly. See Paddle CI Manual for details.

paddle/fluid/operators/reduce_ops/reduce_op.h

paddle/pten/kernels/gpu/elementwise.h

zhiqiu

LGTM for shareDataWith

ZzSean

LGTM for ci op benchmark

#38959)" This reverts commit 9059ef6.

#38959)" (#39205) This reverts commit 9059ef6.

AnnaTrainingG closed this Jan 14, 2022

AnnaTrainingG force-pushed the Reduce_Grad branch from 1b0ecb6 to f634c0b Compare January 14, 2022 12:14

AnnaTrainingG reopened this Jan 14, 2022

ZzSean reviewed Jan 14, 2022

View reviewed changes

paddle/fluid/operators/reduce_ops/reduce_op.h Outdated Show resolved Hide resolved

paddle/fluid/operators/reduce_ops/reduce_op.h Outdated Show resolved Hide resolved

xingfeng01 previously approved these changes Jan 17, 2022

View reviewed changes

JamesLim-sy reviewed Jan 17, 2022

View reviewed changes

paddle/pten/kernels/gpu/elementwise.h Show resolved Hide resolved

AnnaTrainingG dismissed xingfeng01’s stale review via 5fdcbec January 18, 2022 11:22

AnnaTrainingG changed the title ~~Reduce EigenBroadcastcase with ElementwiseBroadcast in ReduceGrad~~ Replace EigenBroadcastcase with ElementwiseBroadcast in ReduceGrad Jan 18, 2022

AnnaTrainingG force-pushed the Reduce_Grad branch from b75a790 to e445517 Compare January 19, 2022 07:19

AnnaTrainingG added 7 commits January 24, 2022 02:24

update

c03f5ad

update

e5bd202

update

e4e4e37

update

e8d7fc3

update

6c0352f

update reset

528942a

update elementwise.h

a41aca9

update

184261f

AnnaTrainingG force-pushed the Reduce_Grad branch from d5a65d1 to 184261f Compare January 24, 2022 02:29

zhiqiu approved these changes Jan 25, 2022

View reviewed changes

xingfeng01 approved these changes Jan 25, 2022

View reviewed changes

ZzSean approved these changes Jan 25, 2022

View reviewed changes

AnnaTrainingG changed the title ~~Replace EigenBroadcastcase with ElementwiseBroadcast in ReduceGrad~~ Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad Jan 25, 2022

AnnaTrainingG merged commit 9059ef6 into PaddlePaddle:develop Jan 25, 2022

AnnaTrainingG added a commit that referenced this pull request Jan 25, 2022

Revert "Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad (

af0eca9

#38959)" This reverts commit 9059ef6.

AnnaTrainingG mentioned this pull request Jan 25, 2022

Revert "Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad" #39205

Merged

AnnaTrainingG added a commit that referenced this pull request Jan 25, 2022

Revert "Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad (

978558b

#38959)" (#39205) This reverts commit 9059ef6.

ZzSean mentioned this pull request Jan 25, 2022

[Pten]Change Infermeta for API && Remove MakePtenDenseTensor in reshape kernel #39186

Merged

AnnaTrainingG mentioned this pull request Mar 8, 2022

[Phi] Reduce grad #40263

Merged

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad #38959

Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad #38959

AnnaTrainingG commented Jan 14, 2022 •

edited

Loading

paddle-bot-old bot commented Jan 14, 2022

zhiqiu left a comment

ZzSean left a comment

Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad #38959

Replace EigenBroadcast with ElementwiseBroadcast in ReduceGrad #38959

Conversation

AnnaTrainingG commented Jan 14, 2022 • edited Loading

PR types

PR changes

Describe

paddle-bot-old bot commented Jan 14, 2022

zhiqiu left a comment

Choose a reason for hiding this comment

ZzSean left a comment

Choose a reason for hiding this comment

AnnaTrainingG commented Jan 14, 2022 •

edited

Loading