Agent57智能体在街机学习环境,集所有 57 个雅达利游戏中都优于人类。DeepMind引入了Agent57智能体,为建立更强大的人工智能决策模型奠定了基础。
DeepMind的长期研究目标是让一名代理(http://www.maoyihang.com/invest/)人完成尽可能多的任务,并被该公司(http://www.maoyihang.com/company/)视为迈向一般人工智能的唯一途径。
2019年,DeepMind的MuZero 在 51 款雅达利游戏中实现了超越人类的表现。几个月后,DeepMind在这一领域第一次超越了人类,在57个款雅达利游戏中超越了人类。
也就是说,Agent57智能体可以为建立一个更强大的人工智能决策模型奠定基础Agent57智能体也可以随着计算复杂度的增加而扩展,训练时间越长,得分就越高。
一般来说,使用游戏来评估Agent57智能体的表现是强化学(http://www.maoyihang.com/sell/l_9/)习研究中的一种常见做法。游戏中的环境是对真实环境的一种模拟。
Agent57智能体在游戏中所能处理的环境越复杂,它在实际环境中的适应性就越强。包含57个 57 款雅达利游戏的街机学习环境可以为强化学习Agent57智能体提供各种复杂的挑战,因此被视为评估Agent57智能体普遍能力的理想测试场所。