昨天我们采用了fasttext进行文本处理分类,今天我们使用word2vec模型进行训练。
word2vec工具主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(continuous bag of words,简称CBOW),以及两种高效训练的方法:负采样(negative sampling)和层序softmax(hierarchical softmax)。值得一提的是,word2vec词向量可以较好地表达不同词之间的相似和类比关系。
Genening
Nothing is everything
SYSU
Posts
76
Categories
11
Tags
61
log
Python
Practical skills
Mathematics