note 2022-04-05 Nlp NLP-文本分类 TODO 文本分类算法综述 一文总结文本分类必备经典模型 文本分类任务简介 一般, 文本分类大致分为以下几个步骤: 定义阶段 定义数据以及分类体系, 具体分为哪些类别, 需要哪些数据 数据预处理 对文档做分词、去停用词等准备工作 数据提取特征 对文档矩阵进行降维, 提取训练集中最有用的特征 模型训练阶段 选择具体分类模型以及算法, 训练出文本分类器 评测阶段 在测试集上测试并评价分类器性能 应用阶段 应用性能最高的分类模型对待分类文档进行分类 朴素贝叶斯分类模型 理论 实现
note 2022-04-05 Nlp NLP-文本分类 TODO 文本分类算法综述 一文总结文本分类必备经典模型 文本分类任务简介 一般, 文本分类大致分为以下几个步骤: 定义阶段 定义数据以及分类体系, 具体分为哪些类别, 需要哪些数据 数据预处理 对文档做分词、去停用词等准备工作 数据提取特征 对文档矩阵进行降维, 提取训练集中最有用的特征 模型训练阶段 选择具体分类模型以及算法, 训练出文本分类器 评测阶段 在测试集上测试并评价分类器性能 应用阶段 应用性能最高的分类模型对待分类文档进行分类 朴素贝叶斯分类模型 理论 实现