Gran Turismo运动 是赛车游戏复音数字人工智能在赛车视频游戏中的三个不同曲目中击败了世界上最好的四个人类司机 Gran Turismo运动 ,通过在轨道最困难的部分获得地面。
名叫GT Sophy的AI能够执行战术动作,例如使用对手的滑道来提高自己的向前并阻止其对手传球 。
纽约索尼AI的彼得·沃尔曼(Peter Wurman)和他的同事使用深度强化学习训练了该系统,这是一种使用奖励和惩罚来教授AI的神经网络如何获胜的机器学习。在训练过程中 ,在单独的计算机上运行的GT Sophy同时在20个PlayStation 4游戏机上玩游戏。
该团队赋予了AI加速,制动和转向的能力,以及有关汽车在游戏中的位置(包括其自己的位置)的实时信息 ,以及赛道接下来6秒的地图,这意味着当AI更快地行驶时,您会看到更长的距离 。研究人员指出 ,人类玩家无法获得此信息,这给人工智能带来了一些优势,但说人们还有其他优势,例如手动更换齿轮的能力 ,AI没有。
沃尔曼(Wurman)和他的团队奖励了GT Sophy待在球场上并开车更快,并为AI罚款或放慢脚步而对AI进行了惩罚。在几天之内,与在线领导者董事会的排名相比 ,AI学会了超过95%的人类玩家的赛道 。
在大约9天的训练中,GT Sophy在总共45,000个小时内将其单圈的十分之一剃光了,比领导董事会上任何人类球员都要快地完成工作。
但是 ,GT Sophy碰到了一个绊脚石。AI最初避免超越快速对手,以最大程度地降低碰撞风险并最大化奖励 。为了克服这一过度安全的行为,研究人员奖励了AI传递对手并因被淘汰而受到惩罚。
通过与有竞争力的GT球员联手 ,该团队专注于每条曲目中最困难的一小部分,以便GT Sophy可以迅速学习在这些领域中表现出色。然后,研究人员挑战了世界上最佳的四名GT球员 ,以与团队比赛中的四副GT Sophy竞争,因此八辆汽车总共走上了赛道。AI赢得了104至52的冠军,并根据赛车手的最终位置计算得分 。
“结果表明,游戏开发人员有可能使用深厚的增强学习设计和测试他们的游戏 ,并为人类玩家生产有趣的对手和队友,”旧金山OpenAI的Igor Babuschkin说。
这些发现将对改善自动驾驶汽车的影响几乎没有影响,这必须感知环境本身并导航更多可变条件。
“尽管GT Sophy设法取得了令人印象深刻的结果 ,但它非常依赖于微调参数和特定的游戏特征, ”马耳他数字游戏学院的Georgios Yannakakis说 。
和我们一起度过一个令人振奋的思想和经验节。 新科学家直播 正在混合动力,在英国曼彻斯特举行现场亲自活动 ,您也可以从自己的家中享受, 2022年3月12日至14日。查出 更多的 。
本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/jyan/202506-1387.html
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《Gran Turismo AI:计算机驾驶员可以击败一些世界上最好的球员》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览:Gran Turismo运动 是赛车游戏复音数字人工智能在赛车视频游戏中的三个不同曲目中击败了世界上最好的四个人类司机 Gran Turismo运动,通过在轨道最困难的部分获得...