“获取钥匙!”atariAI学会了通过以简单的英语来处理最艰难的Atari视频游戏之一 。
该系统由加利福尼亚斯坦福大学的团队开发,学会了玩游戏 蒙特祖玛的复仇 ,其中玩家搜寻阿兹台克寺庙的宝藏。该游戏对于AI学习而具有挑战性,因为它提供了稀疏的奖励,要求玩家在获得任何积分之前采取多个动作。
大多数视频游戏AIS都使用加强学习来制定策略,并依靠像游戏点这样的反馈来告诉他们何时表现良好。为了更快地帮助他们采用游戏策略 ,斯坦福大学团队以自然语言说明的形式提供了强化学习系统的帮助,例如建议它“爬上梯子 ”或“获取钥匙” 。
团队成员罗素·卡普兰(Russell Kaplan)说:“想象一下,要教孩子打网球 ,通过递给他们球拍,将他们留在球机前10年。这基本上就是我们现在教AI的方式。”“事实证明,孩子们与教练学习得更快 。”
以这种方式教授AI可能会有深远的应用程序 ,因为使用自然语言意味着任何人都可以建议AI,而不仅仅是计算机程序员。
该小组首先培训了AI,将指示与游戏中正在执行的相同动作的屏幕截图相关联。然后 ,他们让IT练习玩游戏的列表,其中每个房间都可以通过游戏角色通过,以完成命令并在游戏中进行奖励 。
为了表明它正在对诸如“爬上梯子 ”之类的命令发展 ,研究人员进行了另一个实验,在该实验中,他们删除了第二个房间的培训数据。卡普兰说,尽管以前从未见过 ,该系统仍然能够遵循该房间的说明,这表明这不仅仅是死记硬背。相反,这可能是从以前的说明中概括的 。当发现更好的策略时 ,它还学会了忽略指令。
该系统在游戏中得分3500点,在OpenAI体育馆(Openai Gym)上粉碎了2500分的最高分数,这是一个在线测试AIS在虚拟环境中测试AIS的平台。Google DeepMind AI在游戏中的得分高达6600 ,但训练近两倍 。它将加强学习与一种称为内在动机的方法相结合,这使AI奖励了好奇和探索其环境。
卡普兰(Kaplan)说,谷歌的方法更为先进 ,但他认为这两种方法是互补的,想尝试将它们结合起来。该小组还计划随着AI在游戏中的进步时减少说明的数量,以查看其从被告知的内容中学习的速度 ,并停止依赖于此类指导。
卡内基·梅隆大学(Carnegie Mellon University)的Devendra Chaplot说,使用自然语言指导是一种有趣的方法 。他说:“这非常有用,因为它为人类指导AI系统提供了一种自然的方式。”
不过,将其转换为现实世界可能是一个挑战。Chaplot说:“该项目使用固定的说明 ,但是了解自由形式的自然语言指示是一个非常具有挑战性的开放问题 。”
卡普兰说,他们有利于他们的一件事是将现实世界图像与自然语言描述联系起来的丰富数据集,这些图像可用于帮助训练这样的AI。
本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/cshi/202506-1554.html
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《人工智能学会从简单英语的说明中玩电子游戏》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览:“获取钥匙!”atariAI学会了通过以简单的英语来处理最艰难的Atari视频游戏之一。该系统由加利福尼亚斯坦福大学的团队开发,学会了玩游戏 蒙特祖玛的复仇,其中玩家搜寻阿兹台...