首页 > 其他
题目内容 (请给出正确答案)
[多选题]

我们想要训练一个ML模型,样本数量有100万个,特征维度是5000,面对如此大数据,如何有效地训练模型()。

A.对训练集随机采样,在随机采样的数据上建立模型

B.尝试使用在线机器学习算法

C.使用PCA算法减少特征维度

查看答案
答案
收藏
如果结果不匹配,请 联系老师 获取答案
您可能会需要:
您的账号:,可能还需要:
您的账号:
发送账号密码至手机
发送
安装优题宝APP,拍照搜题省时又省心!
更多“我们想要训练一个ML模型,样本数量有100万个,特征维度是5…”相关的问题
第1题
用决策树训练一个分类器模型,树的每个叶子结点代表了()信息。

A.样本数量

B.无实际意义

C.分类标签

D.变量数量

点击查看答案
第2题
我们想要减少数据集中的特征数,即降维.选择以下适合的方案:()。

A.使用前向特征选择方法

B.使用后向特征排除方法

C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征

D.查看相关性表,去除相关性最高的一些特征

点击查看答案
第3题
利用WAGE2.RAW中的数据估计一个简单回归,以便用智商(IQ)来解释月薪(wage)。 (i)求出样本中的平
利用WAGE2.RAW中的数据估计一个简单回归,以便用智商(IQ)来解释月薪(wage)。

(i)求出样本中的平均工资和平均IQ。IQ的样本标准差是多少?(总体中的IQ已标准化为平均值是100,标准差是15。)

(ii)估计一个简单回归模型,其中IQ提高一个单位导致wage变化相同的数量。利用这个模型计算IQ提高15个单位时,工资的预期变化。10能够解释大多数工资波动吗?

(iii)现在再估计一个模型,其中IQ提高一个单位对工资具有相同的百分比影响。如果IQ提高15个单位,预期工资提高的百分比大约是多少?

点击查看答案
第4题
模型评估方法中留出法的缺点是()。

A.在数据集比较大的时候,训练M个模型的计算开销可能是难以忍受的

B.改变了初始数据集的分布,引入估计偏差

C.样本利用率低

D.只能得到一个评估值

点击查看答案
第5题
所谓的训练数据,就是经过预处理后,有相对稳妥、精确的特征描述的数据集,以“样本”形式参与模型开发工作。()
点击查看答案
第6题
在有指导的数据挖掘中,有关测试集的说法正确的是()。

A.测试集和训练集是相互联系的

B.测试集是用以测试模型的数据集

C.通常测试集大约占总样本的三分之一

D.K-次交叉验证中,测试集只有1个,训练集有K-1个

点击查看答案
第7题
去噪自编码器可以利用含缺失值的样本进行训练,训练出可以用于填补缺失值的模型。()
点击查看答案
第8题
想要完美的塑造语音亲和力,我们需要进行的专项训练主要包括()。

A.气息控制

B.节奏变化

C.共鸣运用

D.语气表达

E.吐字归音

点击查看答案
第9题
你觉得为什么要做交叉验证呢?()

A.评估模型的预测性能

B.判断训练后的模型如何在样本之外的测试数据上执行

C.节省因收集整理数据而消耗的时间

D.以上均对

点击查看答案
第10题
关于变分自编码器VAE,以下说法正确的有:()

A.VAE的变分下界由KL散度项和模型重建误差项组成

B.VAE是一类生成模型,可用于训练出一个样本的生成器

C.VAE的变分下界中,KL散度项可以为负值

D.VAE广泛用于生成图像

点击查看答案
第11题
一个家庭有6个孩子。孩子的数量即为总体的大小。对总体进行不放回的简单随机抽样,样本容量为2,则有多少种可能的样本()

A.12

B.15

C.3

D.16

点击查看答案
退出 登录/注册
发送账号至手机
密码将被重置
获取验证码
发送
温馨提示
该问题答案仅针对搜题卡用户开放,请点击购买搜题卡。
马上购买搜题卡
我已购买搜题卡, 登录账号 继续查看答案
重置密码
确认修改