> 迁移学习的能力就是其中一个障碍,当然,还有其他原因使得很难 将强化学习在游戏中的成功扩展到现实世界。像《打砖块》和围棋这样 的游戏非常适合使用强化学习,因它们有清晰的规则、直截了当的奖 励机制,以及相对较少的可能动作(如行棋)。此外,玩家有获得完整 信息的途径:游戏的所有部分始终对玩家可见,玩家的状态没有隐藏或 不确定的部分。 > > 然而,==现实世界并不是如此清晰划定的==。侯世达指出:“状态’这一 概念在现实生活中根本不存在明确的定义。如果你仔细观察现实生活中 的各种情形,你会发现它们并不都像国际象棋或围棋那样具有条条框框 的规则…==现实世界中的各种情形根本就没有边界==,你不知道情形之中 是什么,也不知道情形之外是什么。” > > -- [[Artificial Intelligence -- A Guide for Thinking Humans]] [[知识迁移的能力使专业人工智变为通用人工智能]]