“合肥高新杯”心电人机智能大赛——心电异常事件预测冠军解决方案

赛题地址

https://tianchi.aliyun.com/competition/entrance/231754/introduction

开源baseline

感谢比赛期间JavisPeng开源的优质baseline

比赛分数

赛题回顾

问题描述：依据心电图机8导联的数据和年龄、性别特征，预测心电异常事件
比赛数据：32142条初赛数据和20036条复赛数据（初赛数据有重复，初复赛标签分布差异大）
评价指标：MicroF1

数据分析

标签相关性：计算公式为两标签交集数量除以两标签并集数量，0表示完全互斥。该相关性也可视为一种“特征”。

不同导联节拍一致：尖峰位置一致。

不同导联十分相似：将不同导联画在同一坐标轴上，可看出相似性。如何构建模型以利用这种相似性是最为关键的思路。

模型构建

针对多导联心电图分类任务，我创新地提出一种网络结构，将其称之为ECGNet: Multi-scale ResNet for Multi-lead ECG Data。该模型是本次比赛的致胜关键。（细节可见PPT）

模型融合

模型融合阶段效果提升，我认为主要有两点原因：

充分利用初赛和复赛的数据
“隐含”地利用了不同标签的相关性

不足之处：

模型缺乏多样性
没有用到传统特征和树模型

此外，植物提出的嫁接学习也是种很有意思的思路。

效果评估

线下对20类标签用单模型评估效果，反正比我自己判断的（仅限电轴偏转方向）好得多。

经验总结

充分利用提供的数据很重要，尤其分布差异很大时。
多去思考多去尝试。

在处理多导联心电图数据时：

对不同导联应用相同的卷积核，能在减小参数量的同时，很好地提升模型的效果。
采用多尺度网络能捕捉不同尺度的特征，较好地提升模型的效果。
网络初期可以采用较大的卷积核，后期可以采用较小的卷积核。
BN-ReLU-Conv要优于Conv-BN-ReLU。
Squeeze-and-excitation结构也能提升模型的效果。
传统特征也很重要。

失败尝试

以下是一些失败的尝试（不代表这些方法真的不行，也许是我的打开方式有问题）：

傅里叶变换
小波变换
频谱图
DenseNet
EfficientNet
Attention
LSTM
滑动窗口
去噪
特征工程

总之还是要多思考多去尝试吧，没有什么事能一帆风顺的。

赛后感想

本次比赛收获颇丰，除了实质性奖励以外，还锻炼了我赛题思考、数据分析、模型构建、论文阅读、编程实现以及答辩的能力，且与其他选手交流了一些有趣的思路。
客观上来看，本次比赛有很大的运气成分的，自己还有很多不足。总之，继续努力，再接再厉吧。
~~单人参赛好累啊，还有复现阶段需要抓紧时间，我差点没在期限内整出来。~~

PS

很多细节我没有详细介绍，有兴趣地可以看PPT或答辩视频。

答辩视频

https://tianchi.aliyun.com/course/video?liveId=41127

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

README.md

README.md

“合肥高新杯”心电人机智能大赛——心电异常事件预测冠军解决方案

赛题地址

开源baseline

比赛分数

赛题回顾

数据分析

模型构建

模型融合

效果评估

经验总结

失败尝试

赛后感想

PS

答辩视频

Files

README.md

Latest commit

History

README.md

File metadata and controls

“合肥高新杯”心电人机智能大赛——心电异常事件预测冠军解决方案

赛题地址

开源baseline

比赛分数

赛题回顾

数据分析

模型构建

模型融合

效果评估

经验总结

失败尝试

赛后感想

PS

答辩视频