DeepMind AI解决了数学奥林匹克运动物的硬几何问题

几何问题涉及在复杂形状中证明有关角度或线条的事实Google DeepmindGoogle DeepMind的AI几乎和最佳人类参赛者都可以解决一些国际数学奥林匹克(IMO)问题 。

IMO总裁Gregor Dolinar说:“载流量计的结果令人惊叹和令人叹为观止 。 ”“似乎AI将比几个月前想象的要早得多。 ”

IMO针对中学生,是世界上最困难的数学比赛之一。正确回答问题需要AI系统长期以来一直在努力的数学创造力 。例如 ,GPT-4在其他领域表现出了出色的推理能力 ,在IMO几何问题上得分为0%,而即使是专业的AIS也难以回答以及普通参赛者。

这部分取决于问题的困难,但这也是由于缺乏培训数据。比赛自1959年以来每年举行 ,每个版本都只有六个问题 。但是,一些最成功的AI系统需要数百万或数十亿个数据点。尤其是几何问题构成了六个问题中的一个或两个,并涉及以复杂形状的角度或线条证明事实 ,特别困难地转化为计算机友好的格式。

Google Deepmind及其同事的Thang Luong通过创建一个可以产生数亿个机器可读的几何证明的工具来绕过了这个问题 。当他们使用此数据训练了一个名为AlphageMementry的AI并在30个IMO几何问题上对其进行了测试时,它正确地回答了其中的25个,而IMO金牌得主根据比赛中的得分估计得分为25.9。

“我们的[当前] AI系统仍在努力做出诸如深层推理之类的能力 ,我们需要在许多步骤中进行预先计划,还可以看到大局,这就是为什么数学是如此重要的基准和为我们寻求人工通用情报的测试设置 ,”卢恩告诉新闻发布会。

字母计量学由两个部分组成,luong与大脑中的不同思维系统进行了比较:快速,直观的系统和较慢 ,更分析的系统 。第一个直观的部分是一种语言模型 ,类似于Chatgpt背后的技术,称为GPT-F。它已经接受了数百万个生成的证明的培训,并建议将哪些定理和论点用于问题。一旦提出了下一步 ,更慢但更谨慎的“象征性推理”引擎使用逻辑和数学规则来充分构建GPT-F所建议的论点 。然后,这两个系统串联起作用,彼此之间切换直到解决问题 。

Luong说 ,尽管这种方法在解决IMO几何问题方面取得了非常成功的成功,但其构建的答案往往比人类证明更长,更不错。但是 ,它也可以发现人类错过的东西。例如,它发现了2004年IMO的问题比官方答案中列出的更好的解决方案 。

伦敦数学科学学院的杨赫说,以这种方式解决IMO几何问题令人印象深刻 ,但是该系统在数学上可以使用它可以使用的数学固有限制,因为IMO问题应使用以下未成年人级别的理论来解决。他说,扩大数学知识的数量范围测定法可以访问该系统 ,甚至可以帮助其做出新的数学发现。

他说 ,看到字母度计的如何不知道需要证明什么,这也很有趣,因为数学见解通常可以来自探索没有固定证据的定理 。“如果您不知道自己的终点是什么 ,您能否在所有[数学]路径的集合中找到是否有真正有趣又新的定理? ”

去年,算法贸易公司XTX Markets宣布了1000万美元的AI Maths模型奖金,首次公开共享的AI模型将获得500万美元的大奖 ,该奖金可以赢得IMO金牌,以及对关键里程碑的较小进度奖品。

XTX Markets的Alex Gerko说:“解决IMO几何问题是1000万美元Aimo挑战基金支持的计划进度奖品之一。”“令人兴奋的是,甚至在我们宣布该进度奖的所有细节之前 ,还包括公开可用的模型和数据以及在现场IMO竞赛中解决实际的几何问题,这真是令人兴奋 。”

DeepMind拒绝透露它是否计划在现场IMO竞赛中输入字母度计,还是它正在扩展系统以解决其他不基于几何形状的IMO问题。但是 ,DeepMind先前已经参加了公共竞争,以进行蛋白质折叠预测以测试其AlphaFold系统。


本文来自作者[admin]投稿,不代表东辰文化立场,如若转载,请注明出处:http://www.mzwhys.cn/zhis/202506-1480.html

(15)

文章推荐

  • 核融合可能是未来的清洁能量;但是这些“艰巨的”挑战阻碍了

    科学家的思考方式融合在2022年永远改变的时候,有些人叫世纪的实验首次证明融合可以成为可行的来源清洁能源。该实验在劳伦斯·利弗莫尔国家实验室,显示点火:融合反应产生的能量超过了所产生的能量。此外,过去几年被标记了私人投资在现场的数十亿美元意外收获,主要在美国。你可能喜欢

    2025年06月09日
    13
  • 古代迈锡尼装甲非常好,它在受特洛伊战争启发的11小时战斗模拟中保护了用户

    根据一项新的研究,有13个士兵在其中的复制品中战斗了11个小时,因此3500年前,青铜时代的防弹衣足够强大,可以在3500年前的战斗中保护迈锡尼士兵。研究人员在1960年在丹德拉(Dendra)的考古学家在1960年发现了一套盔甲,这是一个曾经是古希腊城市Mycenae附近的村庄,并从希腊武装部

    2025年06月10日
    11
  • 埃塞俄比亚的狼发现舔“红热扑克”花,如棒棒糖

    一种狼有一点爱吃甜食。醒目的新照片显示埃塞俄比亚狼(canissimensis)以埃塞俄比亚红热扑克花的花蜜为食(Kniphofiafoliosa)。原本严格的食肉动物是观察到食用花蜜的第一个大型食肉物种。研究人员说,他们也可能是第一个充当传粉媒介的大型食肉动物,尽管需要更多的研究来确认其作

    2025年06月12日
    10
  • Chromebook用户的好消息 - 网络上的免费Photoshop即将推出

      Photoshop的高价位过去一直害怕很多人,但是现在Adobe正在测试其著名的图像编辑应用程序的免费版本。  技术新闻网站Verge报告加拿大用户可以在Web上尝试免费使用的Photoshop。Adobe显然希望使其应用程序更容易访问人们,并将测试描述为“免费增值”服务。还计划向订户添

    2025年06月12日
    12
  • 来自帝国边境的古罗马船在塞尔维亚煤矿中发掘

    塞尔维亚的煤矿工人发现,罗马人可能使用的一艘大型木船的遗迹在帝国边境上提供附近的城市和军事总部。考古学家正在等待遗体中的木材放射性日期,但他们认为这可能是公元的第三或第四世纪。viminacium大约1英里(1.6公里)距离公元一世纪初建立。古老的沉船于7月下旬在贝尔格莱德以东约30英里(5

    2025年06月14日
    14
  • 猫真的讨厌我们?

    猫的主人可能喜欢在猫科动物的同伴身上互动,但这是往来的爱情。还是猫真的不喜欢我们?与众不同无条件爱我们的狗,猫经常被指控利用我们满足他们的需求,并且不在乎我们是否生活或死亡。但是,这种超然和计算刻板印象是公平的吗? 指责中有一些事实,因为许多研究发现了猫的证据(猫猫)不要像狗一样爱我们,并会让

    2025年06月14日
    13
  • 尿嘧啶环与氨基酰基tRNA合成酶的活性位点之间的共价加合物

      已经分离出氨基酰基TRNA合成酶和尿嘧啶核苷的共价加合物。酶加合物是催化无活性的。一个核苷在每个催化位点结合。尿苷的释放恢复了酶活性。核苷连接到tRNA相互作用所需的蛋白质段。这些发现为某些蛋白质-核酸复合物的共价成分概念增添了支持。

    2025年06月18日
    10
  • 不适当模型的情况

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月18日
    8
  • 基于大鼠生长软骨从辐射损伤中恢复的体内细胞存活系统

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月19日
    4
  • 负鼠胚胎中的抗体产生

      感谢您访问Nature.com。您使用的是浏览器版本对CSS的支持有限。获得  最佳体验,我们建议您使用更多最新的浏览器(或关闭兼容模式  InternetExplorer)。同时,为了确保继续支持,我们正在展示网站,没有样式  和JavaScript。

    2025年06月19日
    5

发表回复

本站作者后才能评论

评论列表(4条)

  • admin
    admin 2025年06月16日

    我是东辰文化的签约作者“admin”!

  • admin
    admin 2025年06月16日

    希望本篇文章《DeepMind AI解决了数学奥林匹克运动物的硬几何问题》能对你有所帮助!

  • admin
    admin 2025年06月16日

    本站[东辰文化]内容主要涵盖:生活百科,小常识,生活小窍门,知识分享

  • admin
    admin 2025年06月16日

    本文概览:几何问题涉及在复杂形状中证明有关角度或线条的事实Google DeepmindGoogle DeepMind的AI几乎和最佳人类参赛者都可以解决一些国际数学奥林匹克(IMO)问...

    联系我们

    邮件:东辰文化@sina.com

    工作时间:周一至周五,9:30-18:30,节假日休息

    关注我们