-
任务简介
- 本次评测任务主要目标是针对中文电子病历中挖掘出的真实手术实体进行语义标准化。 给定一手术原词,要求给出其对应的手术标准词。所有手术原词均来自于真实医疗数据,并以《ICD9-2017协和临床版》 手术词表为标准进行了标注。
- 官网:http://www.cips-chip.org.cn:8000/evaluation
-
时间:2019.9~2019.11
-
数据示例
一个原始词可能对应多个标准词,中间用‘##’隔开
原始词 标准词 横结肠造口还纳术 横结肠造口闭合术 右肾上腺巨大肿瘤切除术 肾上腺病损切除术 左侧单侧乳房根治性切除术 单侧根治性乳房切除术 经皮三叉神经半月节射频热凝术 三叉神经半月节射频热凝术 右肾探查,右肾根治术 肾探查术##单侧肾切除术 -
数据说明
train dev test 手术词表 数据量 4,000 1,000 2,000 * 最大手术原词长度 122 102 80 * 最小手术原词长度 2 2 3 * 平均手术原词长度 12.36 12.34 12.35 * 手术原词对应最多标准词个数 7 4 5 * 手术原词对应最少标准词个数 1 1 1 * 手术原词对应平均标准词个数 1.07 1.06 1.06 * 最大手术标准词长度 24 24 27 37 最小手术标准词长度 3 4 3 1 平均手术标准词长度 9.14 9.24 9..16 9.16 注:长度不超过20的手术原词在训练集中占比约为94%,在验证集和测试集中将近95%。
-
竞赛方案
方案/rank acc 代码 1(PPT:表格下方) 0.9483 × 2(PPT:表格下方) 0.9272 × 3(PPT:表格下方) 0.9134 × -
推荐资料