资料详情

Titanic生存预测模型设计 课程报告+源码及数据集

头像

Python

编号:1878

实验名称 Titanic: Machine

Learning from Disaster


索引

0.了解Kaggle:

1.观察大局:

2.获得数据:

3.从数据探索和可视化中获得洞见:

4.机器学习算法的数据准备:

5.选择和训练模型:

6.微调模型:


0.了解Kaggle:

Kaggle成立于2010年,是一个进行数据发掘和预测竞赛的在线平台。从公司的角度来讲,可以提供一些数据,进而提出一个实际需要解决的问题;从参赛者的角度来讲,他们将组队参与项目,针对其中一个问题提出解决方案,最终由公司选出的最佳方案可以获得5K-10K美金的奖金。

除此之外,Kaggle官方每年还会举办一次大规模的竞赛,奖金高达一百万美金,吸引了广大的数据科学爱好者参与其中。从某种角度来讲,可以把它理解为一个众包平台,类似国内的猪八戒。但是不同于传统的低层次劳动力需求,Kaggle一直致力于解决业界难题,因此也创造了一种全新的劳动力市场――不再以学历和工作经验作为唯一的人才评判标准,而是着眼于个人技能,为顶尖人才和公司之间搭建了一座桥梁。