资料详情

基于Python实现CCKS2019医渡云4k电子病历数据集命名实体识别 课程论文+项目源码

头像

Python

编号:1942

CCKS2019医渡云4k电子病历数据集命名实体识别

目录

CCKS2019医渡云4k电子病历数据集命名实体识别

Dataset

Project Structure

Requirements

Steps

Model

上游

下游

Config

Train

策略

日志

Evaluate

策略

评估单个模型

Performance

测试集表现

验证集最佳F1

官方提供的379条测试样本表现

官方提供的379条测试样本表现每的类别F1评测结果

Predict

Dataset

Yidu-S4K数据集,对于给定的一组电子病历纯文本文档,任务的目标是识别并抽取出与医学临床相关的实体提及(entity mention),并将它们归类到预定义类别(pre-defined categories),比如疾病、治疗、检查检验等。

1. 疾病和诊断:医学上定义的疾病和医生在临床工作中对病因、病生理、分型分期等所作的判断。

2. 检查: 影像检查(X线、CT、MR、PETCT等)+造影+超声+心电图,未避免检查操作与手术操作过多冲突,不包含此外其它的诊断性操作,如胃镜、肠镜等。

3. 检验: 在实验室进行的物理或化学检查,本期特指临床工作中检验科进行的化验,不含免疫组化等广义实验室检查

4. 手术: 医生在患者身体局部进行的切除、缝合等治疗,是外科的主要治疗方法。

5. 药物: 用于疾病治疗的具体化学物质。

6. 解剖部位: 指疾病、症状和体征发生的人体解剖学部位。