A.ε-greedy策略是一种平衡“探索”和“开发”的方法
B.“开发”表示随机地采取某个动作,以便于尝试各种结果;“探索”表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值
C.主体和环境之间交互的要素有状态、动作、回报
D.在强化学习的过程中,学习率α越大,表示保持旧的学习结果的比例越大
第1题
A、在强化学习中,计算机通过不断与环境交互并通过环境反馈来逐渐适应环境
B、强化学习的概念是从Alphago战胜李世石之后才提出的
C、强化学习属于无监督学习的一种,不需要有监督信息
D、强化学习和有监督学习的过程相似,是“开环”的过程
第2题
A、Policy based的强化学习类型要明显优于Value based和Action based的方法
B、强化学习中的Agent有明确的目标用于指导自己的行为
C、Agent的模型参数是根据环境的反馈来更新
D、强化学习被广泛应用在自动驾驶、电子竞技和AI游戏中
第4题
A、顿悟说认为问题解决的过程不是一个突变的过程,而是循序渐进的过程。
B、操作性条件反射的学习观,不太强调强化在学习中的作用,而是注重模仿的习地过程。
C、试误说认为学习是一个不断尝试不断学习的过程。
D、经典性条件反射的学习观认为学习是一个以突然方式把握问题情景中诸事物关系的过程。
第5题
B.由好感而试用产品,如宝洁公司的产品----经典条件反射理论
C.农夫果园喝前摇一摇的广告----社会学习理论
D.猩猩取香蕉的实验体现的联想学习理论
第7题
A、学习焦虑一般表现为忧虑、紧张、恐惧、肌肉紧张、呼吸急促等。
B、考试焦虑是学习焦虑中的一种特殊表现形式,也称怯场。
C、家庭、学校的期待和社会环境的压力是造成学生学习焦虑水平过高的外在因素。
D、学习焦虑的解除有助于学习成绩的提高。
E、认真备考,对考试性质有恰当的认识,能有效地降低考试中的焦虑情绪。
第10题
A、包括对课程教学活动设计和教学过程的评价两个方面
B、综合使用起始评价、过程评价、总结评价
C、媒体的广泛性、适合性、有效利用性和可持续发展性
D、一是社会发展对教师提出的要求;二是教师工作本身所固有的特点与规律
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!