题目内容
(请给出正确答案)
[单选题]
在强化学习中,通过哪两个步骤的迭代,来学习得到最佳策略()?
A.动态规划与Q-Learning
B.策略优化与策略评估
C.Q-learning与贪心策略优化
D.价值函数计算与动作-价值函数计算
查看答案
如果结果不匹配,请 联系老师 获取答案
A.动态规划与Q-Learning
B.策略优化与策略评估
C.Q-learning与贪心策略优化
D.价值函数计算与动作-价值函数计算
通过一定的榜样来强化相应的学习或学习行为倾向是()。
A.直接强化
B.自我强化
C.负强化
D.替代强化
通过反复的学习,儿童可以用“狗”或"dog"来代表他所看到的具体的狗,这是一种 ()
A.符号学习
B.概念学习
C.命题学习
D.总括学习
A.学情分析不是必需的,在教学中可有可无
B.学情分析是要为教学提供基本依据的
C.学情分析是要通过指导教学,最终指导学生的学习
D.学情分析是为了对学生做出学习成效评价而做的
A.制订学习目标、设置服务内容
B.确定服务小组
C.指导学生撰写工作方案
D.完善工作方案、指导学生开展工作方案说明会
E.指导学生完成服务总结报告
A.目前以数据驱动为核心的机器学习方法可从任意大数据(无论数据是具备标签还是不具备标签)中来学习数据模式,完成给定任务
B.强化学习的基本特征是智能体与环境不断进行交互,在交互过程不断学习来完成特定任务
C.目前以数据驱动为核心的机器学习方法需要从具有标签的大数据中来学习数据模式,完成给定任务
D.以逻辑规则为核心的逻辑推理方法解释性强