首页 > 其他

题目内容（请给出正确答案）

[多选题]

我们想要训练一个ML模型，样本数量有100万个，特征维度是5000，面对如此大数据，如何有效地训练模型（）。

A.对训练集随机采样，在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“我们想要训练一个ML模型，样本数量有100万个，特征维度是5…”相关的问题

第1题

用决策树训练一个分类器模型，树的每个叶子结点代表了（）信息。

A.样本数量

B.无实际意义

C.分类标签

D.变量数量

点击查看答案

第2题

我们想要减少数据集中的特征数，即降维.选择以下适合的方案：（）。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用，去训练一个模型，得到测试集上的表现.然后我们去掉一个特征，再去训练，用交叉验证看看测试集上的表现.如果表现比原来还要好，我们可以去除这个特征

D.查看相关性表，去除相关性最高的一些特征

点击查看答案

第3题

利用WAGE2.RAW中的数据估计一个简单回归，以便用智商（IQ)来解释月薪（wage)。（i)求出样本中的平

利用WAGE2.RAW中的数据估计一个简单回归，以便用智商(IQ)来解释月薪(wage)。

(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少？(总体中的IQ已标准化为平均值是100，标准差是15。)

(ii)估计一个简单回归模型，其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时，工资的预期变化。10能够解释大多数工资波动吗？

(iii)现在再估计一个模型，其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位，预期工资提高的百分比大约是多少？

点击查看答案

第4题

模型评估方法中留出法的缺点是（)。

A.在数据集比较大的时候，训练M个模型的计算开销可能是难以忍受的

B.改变了初始数据集的分布，引入估计偏差

C.样本利用率低

D.只能得到一个评估值

点击查看答案

第5题

所谓的训练数据，就是经过预处理后，有相对稳妥、精确的特征描述的数据集，以“样本”形式参与模型开发工作。（)

点击查看答案

第6题

在有指导的数据挖掘中，有关测试集的说法正确的是（)。

A.测试集和训练集是相互联系的

B.测试集是用以测试模型的数据集

C.通常测试集大约占总样本的三分之一

D.K-次交叉验证中，测试集只有1个，训练集有K-1个

点击查看答案

第7题

去噪自编码器可以利用含缺失值的样本进行训练，训练出可以用于填补缺失值的模型。（）

点击查看答案

第8题

想要完美的塑造语音亲和力,我们需要进行的专项训练主要包括（）。

A.气息控制

B.节奏变化

C.共鸣运用

D.语气表达

E.吐字归音

点击查看答案

第9题

你觉得为什么要做交叉验证呢？（)

A.评估模型的预测性能

B.判断训练后的模型如何在样本之外的测试数据上执行

C.节省因收集整理数据而消耗的时间

D.以上均对

点击查看答案

第10题

关于变分自编码器VAE，以下说法正确的有：（）

A.VAE的变分下界由KL散度项和模型重建误差项组成

B.VAE是一类生成模型，可用于训练出一个样本的生成器

C.VAE的变分下界中，KL散度项可以为负值

D.VAE广泛用于生成图像

点击查看答案

第11题

一个家庭有6个孩子。孩子的数量即为总体的大小。对总体进行不放回的简单随机抽样，样本容量为2，则有多少种可能的样本（）

A.12

B.15

C.3

D.16

点击查看答案

长沙壹依黑科技有限公司版权所有 ©2024

湘ICP备2024047451号营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）