题目内容
(请给出正确答案)
[多选题]
我们想要减少数据集中的特征数,即降维.选择以下适合的方案:()。
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征
D.查看相关性表,去除相关性最高的一些特征
查看答案
如果结果不匹配,请 联系老师 获取答案
A.使用前向特征选择方法
B.使用后向特征排除方法
C.我们先把所有特征都使用,去训练一个模型,得到测试集上的表现.然后我们去掉一个特征,再去训练,用交叉验证看看测试集上的表现.如果表现比原来还要好,我们可以去除这个特征
D.查看相关性表,去除相关性最高的一些特征
A.建表时指定为ADS的维表,将分区数设置为1
B.建表时指定为ADS的维表,即不进行拆分,可以和任意表关联
C.必须建成ADS分区表,将会有一些限制,比如不能和不同普通表组上的表进行关联等
D.可将该表直接打开到和该表关联的事实表中,做成一张宽表,减少join,提升性能
A.主成分分析要学习一个映射矩阵,其大小是d×l
B.主成分分析学习得到了l个d维大小的向量,这l个d维向量之间彼此相关
C.在主成分分析中,我们将带约束的最优化问题,通过拉格朗日乘子法将其转化为无约束最优化问题
D.每个原始数据的维数大小从d变成了l
A.n
B.m
C.n-m
D.n=m+1