• 谷歌推出了面向几何领域的 AI 模型 AlphaGeometry
  • 发布于 1个月前
  • 61 热度
    0 评论
谷歌推出了面向几何领域的 AI 模型 AlphaGeometry,该模型解决几何问题的能力已接近人类奥林匹克金牌选手。我们一起来看看谷歌是怎么说的。我们的 AI 系统在解决几何问题方面已超越了最前沿技术,为数学推理领域的 AI 发展带来了新进展。

国际数学奥林匹克竞赛,一场体现古希腊奥林匹克精神的现代数学盛会,汇集了全球最杰出的高中数学天才。这场比赛不仅展现了有才华的年轻人,还成为了测试数学和推理领域高级 AI 系统的实验舞台。

在最新发表于《自然》杂志的论文中,我们介绍了 AlphaGeometry —— 一个能在解决复杂几何问题方面达到接近人类奥林匹克金牌得主水平的 AI 系统,标志着 AI 性能的重大飞跃。在对 30 道奥林匹克几何题的基准测试中,AlphaGeometry 在规定时间内解决了 25 道题目。相比之下,之前的最先进系统仅能解决 10 道,而人类金牌得主平均能解决 25.9 道。

论文链接:https://www.nature.com/articles/s41586-023-06747-5

在我们自编的 30 道奥林匹克几何题(IMO-AG-30)的基准测试中,这些题目选自 2000 至 2022 年的奥林匹克竞赛,AlphaGeometry 在比赛时间内解决了其中的 25 道。这接近于人类金牌得主在这些相同题目上的平均得分。而之前的先进方法,即 “吴氏方法”,只解决了 10 道题目。


AI 系统通常在解决几何和数学中的复杂问题时遇到难题,原因是缺乏推理能力和足够的训练数据。AlphaGeometry 结合了神经语言模型的预测力和基于规则的演绎引擎,两者协同作用以找出解决方案。我们还开发了一种生成大量合成训练数据的方法,创造了 1 亿个独特的例子,这使得我们能在无需任何人类示范的情况下训练 AlphaGeometry,有效解决了数据瓶颈问题。

AlphaGeometry 展现了 AI 在逻辑推理、发现和验证新知识方面的日益增强的能力。解决奥林匹克级别的几何问题是我们在发展深层数学推理能力、朝向更高级和更通用 AI 系统的道路上的一个重要里程碑。我们已经开放了 AlphaGeometry 的代码和模型,希望它能与合成数据生成和训练领域的其他工具和方法一起,为数学、科学和 AI 领域带来新的发展机遇。

代码:https://github.com/google-deepmind/alphageometry

AI 研究者首先尝试着解决 IMO 几何题目是非常明智的,因为这些问题的解题过程有点像下棋,每一步都有有限的合理选择。但我对他们能够做到这点感到非常震惊,这确实是一项令人吃惊的成就。
—— 菲尔兹奖得主、IMO 金牌得主吴宝珠

一.AlphaGeometry 采用神经符号方法

AlphaGeometry 是一个融合了神经语言模型和符号演绎引擎的神经符号系统。这两种系统协同工作,以找出复杂几何定理的证明。就像是 “快速与缓慢思考” 的理念,一个系统快速提供 “直觉式” 的想法,而另一个负责更为谨慎和理性的决策。


由于语言模型擅长识别数据中的通用模式和关系,它们能迅速预测出可能有用的构造,但常常缺乏严密的推理能力或无法解释其决策。而符号演绎引擎则基于严格的逻辑,使用明确的规则得出结论。这些引擎虽然理性且可解释,但处理单独的大型复杂问题时可能显得 “慢” 而且不够灵活。

AlphaGeometry 的语言模型引导其符号演绎引擎朝向解决几何问题的可能方案。奥林匹克几何题通常基于需要在解题前添加新几何元素(如点、线或圆)的图形。AlphaGeometry 的语言模型预测哪些新元素最有助于解题,从众多可能性中作出选择。这些线索帮助填补信息空白,使得符号引擎可以对图形进行更深入的推断,逐步接近解题答案。

AlphaGeometry 解决一个简单问题的过程。AlphaGeometry 解决一个简单问题:首先给出问题图形及其定理前提(左侧),然后 AlphaGeometry(中间)使用符号引擎对图形进行新的陈述推导,直到找到解决方案或无法再推导出新陈述为止。如果找不到解决方案,AlphaGeometry 的语言模型会添加一个可能有用的构造(蓝色标记),为符号引擎提供新的推理路径。这个循环一直进行,直到找到解决方案(右侧)。在此示例中,只需添加一个构造即可。

AlphaGeometry 解决了一项奥林匹克级的难题:2015 年国际数学奥林匹克第 3 题(左图),以及 AlphaGeometry 精简版的解答过程(右图)。蓝色部分代表添加的几何构造。AlphaGeometry 的解答包含了 109 个逻辑步骤。
查看完整解答过程:https://storage.googleapis.com/deepmind-media/DeepMind.com/Blog/alphageometry-an-olympiad-level-ai-system-for-geometry%20/AlphaGeometry%20solution.pdf

二.生成 1 亿个合成数据样例

几何学是理解空间、距离、形状和相对位置的学科,对艺术、建筑、工程等多个领域至关重要。人们通常通过笔和纸来学习几何,检验图形并利用现有知识揭示新的、更复杂的几何特性和关系。我们的合成数据生成方法仿照了这种知识构建过程,并将其扩展到大规模,使我们得以从零开始训练 AlphaGeometry,无需任何人类示范。


AlphaGeometry 利用高度并行化计算,首先生成了十亿个随机的几何对象图表,并详尽地推导出每个图表中点和线之间的所有关系。AlphaGeometry 找出了每个图表中所有的证明,然后逆向推理出为获得这些证明需要添加哪些额外的构造。我们将这一过程称为 “符号演绎与追溯”。

图3.AlphaGeometry 生成的合成数据的视觉展示
这个庞大的数据集经过筛选,排除了相似的示例,最终形成了一个包含 1 亿个不同难度、独特的训练样例,其中有九百万个示例包含了新添加的几何元素。由于拥有如此众多示例展示了这些元素如何导致证明,AlphaGeometry 的语言模型能够在处理奥林匹克级别的几何问题时,有效地为新增构造提出合适的建议。

用 AI 引领数学推理的新时代
AlphaGeometry 解答的每个奥林匹克题目都经过了计算机的严格检查和验证。我们还将其成果与以往的 AI 方法和奥林匹克中的人类选手的表现进行了对比。此外,数学教练及前奥林匹克金牌得主 Evan Chen 对 AlphaGeometry 的部分解答进行了评估。

Chen 表示:“AlphaGeometry 的输出结果令人震惊,既可验证又清晰。过去 AI 解决基于证明的竞赛问题时,结果时好时坏(输出有时是正确,但需要人工检验)。AlphaGeometry 没有这个问题:它的解答具有机器可验证的结构。更重要的是,它的输出对人类而言仍然易于理解。人们可能会想象一个用暴力坐标系统解决几何问题的计算机程序,充斥着繁琐的代数运算。但 AlphaGeometry 不是这样,它像学生一样使用经典几何规则,运用角度和相似三角形等。”

AlphaGeometry 的输出令人震惊,因为它既可验证又清晰…… 它像学生一样使用经典几何规则,运用角度和相似三角形等。
—— 数学教练和奥林匹克金牌得主 Evan Chen

由于每届奥林匹克竞赛包含六道题目,通常只有两道与几何有关,因此 AlphaGeometry 只能应用于约三分之一的题目。尽管如此,仅凭其在几何领域的能力,它已成为世界上第一个达到 2000 年和 2015 年国际数学奥林匹克铜牌水平的 AI 模型。

在几何学方面,我们的系统已接近国际数学奥林匹克金牌得主的水平,但我们的目光放得更远:推动下一代 AI 系统的推理能力。鉴于从零开始利用大规模合成数据训练 AI 系统的广阔潜力,这种方法可能会影响未来 AI 系统在数学及其他领域发现新知识的方式。

AlphaGeometry 是基于 Google DeepMind 和 Google Research 的工作,致力于用 AI 推动数学推理的发展 —— 从探索纯数学的美感到利用语言模型解决数学和科学问题。最近,我们还推出了 FunSearch,这是一个利用 LLM 在数学科学领域的开放问题上取得首次发现的工具。我们的长远目标是构建能跨越数学领域的 AI 系统,发展复杂的问题解决和推理能力,这是通用 AI 系统所依赖的。同时,我们还致力于拓展人类知识的边界。

原文链接:https://deepmind.google/discover/blog/alphageometry-an-olympiad-level-ai-system-for-geometry/

前几天谷歌发布了基于大模型的医疗系统,今天又发布了基于大模型的解决几何问题的 AI 系统,持续在大模型方面发力,给人类带来了便捷,关于大模型你有什么想说的,欢迎进入 AI 大模型实验室组织的交流群一起聊聊。
用户评论