题目内容
(请给出正确答案)
[多选题]
进行模型训练之前,需要先把标注好的数据进行分类。训练有监督学习模型时会将数据集划分为()。
A.训练集
B.验证集
C.测试集
D.开发集
E.备份集
查看答案
如果结果不匹配,请 联系老师 获取答案
A.训练集
B.验证集
C.测试集
D.开发集
E.备份集
A.数据标注是模型训练的基石
B.数据标注的准确性大大影响模型准确率
C.数据标注有助于提高工作理解
D.目前模型的发展处于瓶颈期,好的标注数据时制胜关键
A.面向用户同时提供机器学习和深度学习环境,实现从数据预处理、模型训练生产到模型管理等AI建设全工作周期的服务能力
B.对每通通话的第一句话进行语义标注,形成语义训练数
C.对语音文件进行标注,形成语音训练数据
D.对全语音门户机器人对话流程和其他运营指标数据进行管理
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征
D.查看相关性表,去除相关性最高的一些特征
A.企业有大量沉淀数据,需要挖掘数据价值,或快速查询数据等需求B企业数魏分散,存在数据风岛,数据质量薄明,需要治理数理,运营数据资产
B.企业需要实时处理大量数据,进行业务实时监测,并开发训练预测模型
C.企业需要在本地机房内完成资产运营、数据治理、数据价值挖掘、模型开发训练等
A.降低学习率,减少迭代次数
B.降低学习率,增加迭代次数
C.提高学习率,增加迭代次数
D.增加学习率,减少迭代次数
A.降低学习率,减少迭代次数
B.降低学习率,增加迭代次数
C.提高学习率,增加迭代次数
D.增加学习率,减少迭代次数