nlp-5-基于深度学习的文本分类2

前言

昨天我们采用了fasttext进行文本处理分类,今天我们使用word2vec模型进行训练。

什么是word2vec模型?

word2vec工具主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(continuous bag of words,简称CBOW),以及两种高效训练的方法:负采样(negative sampling)和层序softmax(hierarchical softmax)。值得一提的是,word2vec词向量可以较好地表达不同词之间的相似和类比关系。