目录
一、实验描述 1
二、实验目的 1
三、实验环境 1
四、实验步骤 1
5) 使用 pip 安装 sasl(python 远程连接 hive)(若 pip 安装失败,可使用 conda install 22
五、实验结果与分析 27
一、实验描述
利用 hive 命令行完成搜狗日志各项数据分析,使用 Python 进行数据可视化。主要步骤包括:安装部署 Hive、启动 Hadoop 集群、进入 Hive 命令行、创建数据库和数据表、加载或导入数据、用Hive SQL 完成需求、使用 Python 实现数据可视化。
二、实验目的
1.掌握安装Hive 的方法;
2.掌握Hive 创建数据库、导入数据的方法;
3.学会使用Hive SQL 分析数据;
4.学会数据可视化的方法。
三、实验环境
1.虚拟机数量:3;
2.系统版本:Centos 7.5;
3.Hadoop 版本:Apache Hadoop 2.7.3;
4.MySQL 版本:MySQL 5.7.30;
5.Hive 版本:Apache Hive 2.1.1。












