Add fused_linear_param_grad_add_kernel #51805

sneaxiy · 2023-03-17T15:57:48Z

PR types

Performance optimization

PR changes

OPs

Describe

Add fused_linear_param_grad_add_kernel for GPT performance optimization.

… add_fused_linear_param_grad_add

…sneaxiy/Paddle into add_fused_linear_param_grad_add

ForFishes

LGTM

chenwhql · 2023-03-22T03:33:36Z

paddle/phi/kernels/fusion/gpu/fused_linear_param_grad_add_kernel.cu

+#include "paddle/phi/kernels/fusion/fused_linear_param_grad_add_kernel.h"
+
+#if defined(PADDLE_WITH_CUDA) && CUDA_VERSION >= 11060
+#include "paddle/fluid/operators/fused/fused_gemm_epilogue_op.h"


这里不能在include fluid头文件了，已经在编译单独的so了

线下讨论，将在下一个PR里修复。感谢指出。

sneaxiy added 2 commits March 17, 2023 23:56

add fused_linear_param_grad_add_kernel

52d3b62

fix compile error

115cfb1

sneaxiy force-pushed the add_fused_linear_param_grad_add branch from e69115a to 115cfb1 Compare March 18, 2023 00:53

sneaxiy and others added 9 commits March 20, 2023 08:54

remove flag

39c3a39

Merge branch 'develop' of https://github.com/PaddlePaddle/Paddle into…

88ac785

… add_fused_linear_param_grad_add

fix ci compile error

1d176f0

Merge branch 'develop' into add_fused_linear_param_grad_add

d362c8e

fix ci compile error

ab07ef0

Merge branch 'add_fused_linear_param_grad_add' of https://github.com/…

62a929c

…sneaxiy/Paddle into add_fused_linear_param_grad_add

revert pylayer revision

b1e4380

fix ci ut

81a16e2

improve performance

8410a4d

sneaxiy requested a review from ForFishes March 21, 2023 13:44

ForFishes approved these changes Mar 21, 2023

View reviewed changes

sneaxiy requested a review from zyfncg March 22, 2023 03:06

chenwhql reviewed Mar 22, 2023

View reviewed changes

zyfncg approved these changes Mar 22, 2023

View reviewed changes

sneaxiy merged commit f59c5d8 into PaddlePaddle:develop Mar 22, 2023

sneaxiy deleted the add_fused_linear_param_grad_add branch March 22, 2023 05:22

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Add fused_linear_param_grad_add_kernel #51805

Add fused_linear_param_grad_add_kernel #51805

sneaxiy commented Mar 17, 2023

ForFishes left a comment

chenwhql Mar 22, 2023

sneaxiy Mar 22, 2023

Add fused_linear_param_grad_add_kernel #51805

Add fused_linear_param_grad_add_kernel #51805

Conversation

sneaxiy commented Mar 17, 2023

PR types

PR changes

Describe

ForFishes left a comment

Choose a reason for hiding this comment

chenwhql Mar 22, 2023

Choose a reason for hiding this comment

sneaxiy Mar 22, 2023

Choose a reason for hiding this comment