资料详情

基于Python实现的豆瓣探索者对豆瓣多维度可视化分析展示 课程论文+项目源码+安装说明书

头像

Python

编号:2104


第一章 需求分析

现如今阅读、观影、听歌已成为人们日常生活的一部分,每个人手机里或多或少的都有与这些相关的软件。在每一次的欣赏、聆听的背后,都隐藏着数据的奥秘。比如一部电影每个评分数量的多少,反映了大众对于它的直接评价。每年音乐的发行量,反映了彼时音乐创作人的创作量以及音乐市场的火爆程度。

基于以上认识,我们的项目旨在分析与电影、图书、音乐有关的数据去了解一部电影、一首音乐的市场反响,亦或是对多数电影、音乐等综合分析其背后整个市场的情况。因为需要大量的数据集,由此我们便想到了豆瓣这个平台。

我们这个平台主要是爬取豆瓣平台的信息,通过对数据的爬取、存储、读取、处理与分析、可视化等一系列操作,对数据进行了多维度的分析和展示,同时选取了几个热门条目作为例子,进行单个分析,从中得到了许多有效的信息,这些信息一方面可以帮助大众更好的去了解电影、图书、音乐,另一方面也能够为投资者以及从业者带来便利,更好的为他们展示哪些是符合当前市场的。很多人在学习中也会进行相关的案例分析,但本作品与其他竞品有以下区别:

本作品

其他竞品

数据集的获取

本作品的数据集均由团队进

行爬取

其他竞品中的数据集多来自

于教学团队或他人给予

数据集的数量以及质量

本作品的数据集来自豆瓣相对于学习案例的数据集更加

丰富且更有实际意义

其他竞品中的数据集相对单一且数据量小

数据集的分析

本作品对数据的分析更加完

整,更加多元化,能够对数据进行系统的分析

其他竞品中的数据分析角度较单一

数据分析几个的过程

本作品集成了几个步骤为一

体话从数据获取直至数据可视化自动完成

其他竞品中一般为分步骤完成