资料详情

基于Python实现的心脏衰竭致死相关因素研究 课程论文+源码及数据集

头像

Python

编号:2014

心脏衰竭致死相关因素的研究

目录

心脏衰竭致死相关因素的研究

1 基本介绍

12 个特征进行了汇总解释。

2 数据可视化

3.1 变量相关性分析

3 数据预处理

3.2 LASSO 回归

4.1 逻辑回归

4 预测

1 + e−(wXT +b)

4.2 支持向量机 (SVM)

4.3 随机森林

4.4 结果

参考文献

参考文献

数据来源及代码

摘要:心脏衰竭对于人类健康构成了重大威胁,研究心脏衰竭致死的相关因素对于疾病的治疗和预防具有重要意义。基于原始数据集,本文关注了 12 个相关因素,从三个角度递进式的进行分析。首先,对数据进行可视化处理,直观的展现相关关系;其次,利用统计学方法分析了各因素与致死之间的相关性关系,并利用 Lasso 方法得到了更为重要的因素。最后,分别使用机器学习中的逻辑回归方法, 支持向量机(SVM)和随机森林三种模型构建分类器,训练得到用于预测的模型。

关键词: Lasso 方法,逻辑回归,支持向量机

1 基本介绍

心脑血管疾病是人类健康的第一大威胁,每年约有 1790 万人死于该病,占据了全球总死亡人数的

31%。心血管疾病导致易导致心脏衰竭,对人体健康构成直接威胁,分析心脏衰竭致死相关因素,预测心脏衰竭的致死率具有重要价值。相关因素包括年龄,患病时间,各种生理化学指标等等。

本文基于 Davide Chicco, Giuseppe Jurman 的研究调查的数据集,包括了约 300 个病人的信息,对于每个病人,关注了 12 个不同的因素,最后还包括了是否死亡这一重要信息。在下表中我们对

12 个特征进行了汇总解释。