资料详情

Python实现的《数据处理与可视化》实验报告(温度和出行人数的比较、骑行长度和性别年龄) 课程报告+html文件及图

头像

Html/H5

编号:3811

《数据处理与可视化》实验报告

目录

一、 实验内容

二、 数据读取

1. import pandas as pd  

三、 数据清洗

四、 数据可视化

这是清洗前的数据,可以看到订阅用户占比为86.15%

五、 相关性分析

1. import pandas as pd 

六、 感想总结

一、 实验内容

Ø 数据读取

Ø 数据清洗

Ø 数据可视化

Ø 相关性分析

二、 数据读取

首先,需要进行导包操作:

1. import pandas as pd

2. import numpy as np

接着,用pandas来进行对csv中数据的读取:

1. df = pd.read_csv("201506-citibike-tripdata.csv")

2. print(df.head())

输出前五行,得到如下结果:

可以看到,读取成功。

三、 数据清洗

首先,先看是否有空值:

1. print(df.isnull().sum())

发现有空值,删除空值所在行并保存数据到cleanedDate.csv:

1. df = df.dropna()

2. df.to_csv("cleanedData.csv")