题目内容
(请给出正确答案)
[多选题]
下列哪些是TF-IDF的缺点()。
A.字词的重要性随它在文件中出现的次数成正比
B.将一些生僻字误当作文档关键词
C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况
D.没有考虑特征词的位置因素对文本的区分度
查看答案
如果结果不匹配,请 联系老师 获取答案
A.字词的重要性随它在文件中出现的次数成正比
B.将一些生僻字误当作文档关键词
C.只考虑特征词和文本之间的关系,忽略了一个特征项在不同类别间的分布情况
D.没有考虑特征词的位置因素对文本的区分度
A.关键词提取是指用人工方法提取文章关键词的方法
B.TF-IDF模型是关键词提取的经典方法
C.文本中出现次数最多的词最能代表文本的主题
D.这个问题设计数据挖掘,文本处理,信息检索等领域