首页 > 自考

题目内容（请给出正确答案）

[多选题]

在深度学习中采用梯度下降方法往往达不到最优解，而是在以下哪些情况下停止了（）。

A.鞍点

B.局部极值点

C.高原（plateau）点

D.早停点

查看答案

如果结果不匹配，请联系老师获取答案

您可能会需要：

重置密码查看订单联系客服

安装优题宝APP，拍照搜题省时又省心！

更多“在深度学习中采用梯度下降方法往往达不到最优解，而是在以下哪些…”相关的问题

第1题

在深度学习中，我们经常会遇到收敛到localminimum，下面不属于解决localminimum问题的方法是（）。

A.随机梯度下降

B.设置Momentum

C.设置不同初始值

D.增大batchsize

点击查看答案

第2题

假设在一个深度学习网络中，批量梯度下降花费了大量时间时来找到一组参数值，使成本函数小。以下哪些方法可以帮助找到值较小的参数值？（）

A.令所有权重值初始化为0

B.尝试调整学习率

C.尝试mini-batch梯度下降

D.尝试对权重进行更好的随机初始化

点击查看答案

第3题

假设在一个深度学习网络中批处理梯度下降花费了太多的时间来找到一个值的参数值，该值对于成本函数J(W[1],b[1],…,W[L],b[L])来说是很小的值。以下哪些方法可以帮助找到J值较小的参数值()

A.尝试使用Adam算法

B.尝试对权重进行更好的随机初始化

C.尝试调整学习率α

D.尝试mini-batch梯度下降

点击查看答案

第4题

下列关于深度学习中优化问题说法错误的是（）。

A.当优化问题的数值解接近局部最优值时，随着目标函数解的梯度接近或变为零，通过最终迭代获得的数值解可能仅使目标函数局部最优，而不是全局最优

B.在深度学习优化问题中，经常遇到的是梯度爆炸或梯度消失

C.优化问题中设置的学习率决定目标函数能否收敛到局部最小值，以及何时收敛到最小值

D.一般来说，小批量随机梯度下降比随机梯度下降和梯度下降的速度慢，收敛风险较大

点击查看答案

第5题

下面梯度下降说法正确的是？（）

A.随机梯度下降是梯度下降中常用的一种

B.梯度下降包括随机梯度下降和批量梯度下降

C.梯度下降算法速度快且可靠

D.随机梯度下降是深度学习算法当中常用的优化算法之一

点击查看答案

第6题

在深度学习中，下列对于sigmoid函数的说法，错误的是（）。

A.存在梯度爆炸的问题

B.不是关于原点对称

C.计算exp比较耗时

D.存在梯度消失的问题

点击查看答案

第7题

在梯度下降的情况下，以下哪个说法是错误的？（)

A.如果学习率很小，则优化成本函数将花费大量时间

B.如果学习率非常高，则梯度下降可能永远不会收敛

C.学习率是使用损失函数导数和步长来计算的

D.学习率是梯度下降算法中的超参数

点击查看答案

第8题

深度学习中如果神经网络的层数较多比较容易出现梯度消失问题,严格意义上来讲是在以下哪个环节出现梯度消失问题？（)

A.反向传播计算结果

B.反向传播更新参数

C.正向传播更新参数

D.正向传播计算结果

点击查看答案

第9题

梯度爆炸问题是指在训练深度神经网络的时候，梯度变得过大而损失函数变为无穷。在RNN中，下面哪种方法可以较好地处理梯度爆炸问题？（）

A.用改良的网络结构比如LSTM和GRUs

B.梯度裁剪

C.Dropout

D.所有方法都不行

点击查看答案

第10题

当数据过大以至于无法在RAM中同时处理时，哪种梯度下降方法更加有效？（）

A.随机梯度下降法(Stochastic Gradient Descent)

B.不知道

C.整批梯度下降法(FulIBatch Gradient Descent)

D.都不是

点击查看答案

第11题

关于神经网络的相关概念，哪个说法是正确的（)？

A.对激活函数的输出结果进行范围限定，有助于梯度平稳下降，而ReLU输出范围无限的函数会导致梯度消失问题

B.ReLU函数中所有负值均被截断为结果0，从而导致特征丢失，可适当调高学习率避免此类情况

C.RMSProp学习率调整策略引入累积梯度的概念，从而解决学习率过早趋向于0而结束训练

D.随机梯度下降(SGD)每次更新只随机取一个样本，按照固定学习率计算梯度，所以速度较快

点击查看答案

湘ICP备2024047451号营业执照

违法和不良信息举报电话：400-118-7898

举报/反馈/投诉邮箱：deng＃ujigu.com（请将＃替换成@）