A.文本分类是指按照预先定义的主题类别,由计算机自动地为文档集合中的每个文档确定一个类别
B.文本分类大致可分为基于知识工程的分类系统和基于机器学习的分类系统
C.文本的向量形式一般基于词袋模型构建,该模型考虑了文本词语的行文顺序
D.构建文本的向量形式可以归结为文本的特征选择与特征权重计算两个步骤
A.样本选择与预处理->区域选择->特征获取->分类器分类
B.样本选择与预处理->特征获取->分类器分类->区域选择
C.区域选择->样本选择与预处理->分类器分类->特征获取
D.区域选择->样本选择与预处理->特征获取->分类分类
A.使用上位词
B.使用位置算符,两个词的间隔在一定范围内
C.选择检索范围较大的字段
D.不限定检索对象的文档类型、时间段、文种及其它特征
A.探索物体的特征,学习讲述物体的异同
B.学习按物体的数量进行分类
C.学习概括物体(或图形)的两个特征
D.学习按两个特征进行分类和在表格中摆放图形
E.学习按物体的某一外部特征(如颜色、形状、大小)进行分类