DeepMind的AI可以从多个图片中建立对世界的愿景Udo Siebig/Alamy人工智能现在可以将自己放在别人的鞋子上 。DeepMind开发了一个神经网络 ,该神经网络教会自己从不同的观点“想象 ”一个场景,仅基于一个图像。
给定场景的2D图片 - 例如,一个带有砖墙的房间 ,地板上的颜色鲜艳的球体和立方体 - 神经网络可以从不同的有利位点产生3D视图,从而使物体的相对侧面呈现并改变阴影下降以保持相同的光源。
该系统称为“生成查询网络”(GQN),可以从静态图像中汲取细节 ,以猜测空间关系,包括相机的位置 。
“想象一下,您正在看珠穆朗玛峰,然后移动仪表 - 这座山不会改变尺寸 ,这告诉了您与您的距离,” Ali Eslami在DeepMind领导该项目。
“但是,如果您看一下杯子 ,它将改变位置。这类似于这种工作方式 。 ”
为了训练神经网络,他和他的团队从不同的观点展示了一个场景的图像,它用来预测从后面或侧面到侧面的外观。该系统还通过上下文来教授纹理 ,颜色和照明。这与当前监督学习的技术相反,在该技术中,将场景的细节手动标记并馈送给了AI。
AI还可以在虚拟空间中控制对象 ,将其对空间关系的理解应用于将机器人手臂移动以捡起球的情况 。DeepMind的Danilo Rezende说,它也像我们没有意识到一样,学到很多 ,即使我们没有意识到这一点,他也从事该项目。
通过显示神经网络在训练中的许多图像,它可以掩盖相似对象的特征并记住它们。Rezende说:“如果您看到模型内部,我们可以识别代表对象的人工神经元组 ,计算图中的单元 。”
该系统围绕这些场景移动,对事物应该在哪里和应有的外观进行预测,并在预测不正确时进行调整。
从不同的观点拍摄的几张照片后 ,它能够利用这种能力来解决迷宫的布局。
阅读更多: 神经网络的快速崛起以及为什么他们会统治我们的世界
本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/jyan/202506-1419.html
评论列表(4条)
我是东辰文化的签约作者“admin”!
希望本篇文章《DeepMind的AI可以根据一张图片“想象”一个世界》能对你有所帮助!
本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享
本文概览:DeepMind的AI可以从多个图片中建立对世界的愿景Udo Siebig/Alamy人工智能现在可以将自己放在别人的鞋子上。DeepMind开发了一个神经网络,该神经网络教会...