基于 word2vec 实现文本分类
目录
基于 word2vec 实现文本分类 1
实验目的及实验内容 1
实验目的: 1
实验内容: 1
原理分析: 1
实验环境 6
实验结果总结 17
实验目的及实验内容
(本次实验所涉及并要求掌握的知识;实验内容;必要的原理分析) 小题分
实验目的:
用 Python 进行词向量化,学习并使用文本分类算法。
实验内容:
完成基于 word2vec 模型的文本分类任务;
完成基于 Naive Bayesian 的文本分类任务。
要求使用 python 语言编写(或者自选语料库和任务,但要求必须使用 word2vec 和其中一种分类算法完成两次分类任务) 语料库使用群里面提供的素材或者自选。
实验报告中应写出所使用的算法基本原理。
原理分析:
基于 word2vec 模型的文本分类任务
进行文本分类之前,首先要让计算机理解文本,因此需要用一些数学符号或者编码方式来表示文本,该过程被称为文本表示。文本表示的方法有很多种,常用几种方式的如下图所示:








