Skip to content

Latest commit

 

History

History
94 lines (78 loc) · 3.59 KB

README.md

File metadata and controls

94 lines (78 loc) · 3.59 KB

“合肥高新杯”心电人机智能大赛——心电异常事件预测冠军解决方案

赛题地址

https://tianchi.aliyun.com/competition/entrance/231754/introduction

开源baseline

感谢比赛期间JavisPeng开源的优质baseline

比赛分数

赛题回顾

  • 问题描述:依据心电图机8导联的数据和年龄、性别特征,预测心电异常事件
  • 比赛数据:32142条初赛数据和20036条复赛数据(初赛数据有重复,初复赛标签分布差异大)
  • 评价指标:MicroF1

数据分析

  • 标签相关性:计算公式为两标签交集数量除以两标签并集数量,0表示完全互斥。该相关性也可视为一种“特征”。

  • 不同导联节拍一致:尖峰位置一致。

  • 不同导联十分相似:将不同导联画在同一坐标轴上,可看出相似性。如何构建模型以利用这种相似性最为关键的思路。

模型构建

针对多导联心电图分类任务,我创新地提出一种网络结构,将其称之为ECGNet: Multi-scale ResNet for Multi-lead ECG Data。该模型是本次比赛的致胜关键。(细节可见PPT)

模型融合

模型融合阶段效果提升,我认为主要有两点原因:

  1. 充分利用初赛和复赛的数据
  2. “隐含”地利用了不同标签的相关性

不足之处:

  1. 模型缺乏多样性
  2. 没有用到传统特征和树模型

此外,植物提出的嫁接学习也是种很有意思的思路。

效果评估

线下对20类标签用单模型评估效果,反正比我自己判断的(仅限电轴偏转方向)好得多。

经验总结

  • 充分利用提供的数据很重要,尤其分布差异很大时。
  • 多去思考多去尝试。

在处理多导联心电图数据时:

  • 对不同导联应用相同的卷积核,能在减小参数量的同时,很好地提升模型的效果。
  • 采用多尺度网络能捕捉不同尺度的特征,较好地提升模型的效果。
  • 网络初期可以采用较大的卷积核,后期可以采用较小的卷积核。
  • BN-ReLU-Conv要优于Conv-BN-ReLU。
  • Squeeze-and-excitation结构也能提升模型的效果。
  • 传统特征也很重要。

失败尝试

以下是一些失败的尝试(不代表这些方法真的不行,也许是我的打开方式有问题):

  • 傅里叶变换
  • 小波变换
  • 频谱图
  • DenseNet
  • EfficientNet
  • Attention
  • LSTM
  • 滑动窗口
  • 去噪
  • 特征工程

总之还是要多思考多去尝试吧,没有什么事能一帆风顺的。

赛后感想

本次比赛收获颇丰,除了实质性奖励以外,还锻炼了我赛题思考、数据分析、模型构建、论文阅读、编程实现以及答辩的能力,且与其他选手交流了一些有趣的思路。
客观上来看,本次比赛有很大的运气成分的,自己还有很多不足。总之,继续努力,再接再厉吧。
单人参赛好累啊,还有复现阶段需要抓紧时间,我差点没在期限内整出来。

PS

很多细节我没有详细介绍,有兴趣地可以看PPT或答辩视频。

答辩视频

https://tianchi.aliyun.com/course/video?liveId=41127