NLP-文本分类
wangzf / 2022-04-05
TODO
文本分类任务简介
一般, 文本分类大致分为以下几个步骤:
- 定义阶段
- 定义数据以及分类体系, 具体分为哪些类别, 需要哪些数据
- 数据预处理
- 对文档做分词、去停用词等准备工作
- 数据提取特征
- 对文档矩阵进行降维, 提取训练集中最有用的特征
- 模型训练阶段
- 选择具体分类模型以及算法, 训练出文本分类器
- 评测阶段
- 在测试集上测试并评价分类器性能
- 应用阶段
- 应用性能最高的分类模型对待分类文档进行分类
一般, 文本分类大致分为以下几个步骤: