A.进行渗流控制
B.进行帷幕灌浆
C.进行同结灌浆
D.提高地基承载力
第1题
A.ε-greedy策略是一种平衡“探索”和“开发”的方法
B.“开发”表示随机地采取某个动作,以便于尝试各种结果;“探索”表示采取当前认为最优的动作,以便于进一步优化评估当前认为最优的动作的值
C.主体和环境之间交互的要素有状态、动作、回报
D.在强化学习的过程中,学习率α越大,表示保持旧的学习结果的比例越大
第3题
A.强化学习与监督学习没有区别
B.强化学习认为,计算机单纯通过感知环境,与环境交互,并且从交互中获得评价反馈,就可以适应所处的环境
C.强化学习的整个过程形成一个“闭环”
D.与无监督学习相比,强化学习中环境所提供的“奖励”实际上就是监督信号
第4题
A.变极距式
B.变面积式
C.变介电常数式
D.电容式液位传感器
为了保护您的账号安全,请在“上学吧”公众号进行验证,点击“官网服务”-“账号验证”后输入验证码“”完成验证,验证成功后方可继续查看答案!