nlp-6-基于深度学习的文本分类3

前言

在昨天我们实践了word2vec模型,今天还是来学习一个深度学习文本分类模型——bert,这是一个在文本分类中非常著名的模型。接下来让我们来学习一下这个模型。

history

nlp-5-基于深度学习的文本分类2

前言

昨天我们采用了fasttext进行文本处理分类,今天我们使用word2vec模型进行训练。

什么是word2vec模型?

word2vec工具主要包含两个模型:跳字模型(skip-gram)和连续词袋模型(continuous bag of words,简称CBOW),以及两种高效训练的方法:负采样(negative sampling)和层序softmax(hierarchical softmax)。值得一提的是,word2vec词向量可以较好地表达不同词之间的相似和类比关系。

nlp-4-基于深度学习的文本分类

前言

与传统机器学习不同,深度学习既提供特征提取功能,也可以完成分类的功能。从本章开始我们将学习如何使用深度学习来完成文本表示。

nlp-3-基于机器学习的文本分类

1. 前言

文本型数据的读取与训练与图片等其他格式较为一致的数据不同,文本数据一般不定长,所以如果要进行机器学习的矩阵训练,需要先对文本数据进行归一化处理,把文本转换成可以进行运算的shape相同的向量,然后输入算法进行学习。转换的方法有几种,下面的文本表示方法引用自Datawhale零基础入门NLP赛事 - Task3 基于机器学习的文本分类

nlp-2-数据读取与数据分析

前言

昨天我们了解了比赛的基本内容以及一些思路,下载了比赛的数据,今天我们就来探索一下我们现有的数据。

nlp_天池_01

一、前言

NLP是机器学习当中的掌上明珠,只有通过nlp才可能真正的达到“知情达意”的AI。这是一个从零开始学习NLP的项目,通过对项目的探索来达到了解、掌握基本nlp知识的目的。此项目来源于阿里云天池竞赛中的一个新闻文本分类的nlp赛题。