2020李宏毅学习笔记——72 RL Advanced Version8.Imitation Learning

为什么要模仿学习 Imitation Learning (也称为 learning by demonstration, apprenticeship learning) 在某些情况下: 机器也可以和环境进行互动,但是不能明显的得到reward 在某些任务中很难定义reward 人为涉及的奖励可能会得到不受控制的行为 因此需要 imitation learning: 让一个专家来示范应该如何解决问题
相关文章
相关标签/搜索