找回密码
 注册
搜索
免费空间 免费域名 免费AI 老牌主机商首月仅1美分!27美元/年!Namecheap优惠码Spaceship优惠码
查看: 44|回复: 3

Google打破56年未解的数学难题!新一代AI“AlphaEvolve”自创算法,刷新科学探索边界

[复制链接]
发表于 2025-5-27 14:19:51 | 显示全部楼层 |阅读模式
AI不只会下棋、画图或写程序,现在甚至能挑战人类数十年无解的数学难题。
Google DeepMind最新公开的AI系统AlphaEvolve,是一种具备“演化能力”的通用程序设计智能体,可自动搜索并优化各类数学与工程算法。最令人震惊的是,AlphaEvolve成功改写了数学界长达56年无解的经典问题——4x4复数矩阵乘法最少乘法次数,提出史上首个仅需48次乘法的新解法。
不同于传统以强化学习为核心的AlphaGo、AlphaFold,AlphaEvolve是一个更通用的“程序搜索系统”,能将问题以程序方式表达,并通过函数对解法进行自动评估与优化。只要能定义“好坏”的衡量标准(例如速度、准确率、效率等),AlphaEvolve就能不断产出新方案、验证、打分、迭代演进。
Google利用Gemini Flash与Gemini Pro双模型架构,前者快速生成大量程序草案,后者提供更深层逻辑建议,再由自动评估系统对每个候选程序进行验证与打分,让AlphaEvolve像自然界演化般“筛选”出更强的解法。

AlphaEvolve在多达50多个数学难题上进行测试,在20%的题目中找出了比人类更优的解法。最具代表性的成果是提出仅用48次乘法即可完成4×4复数矩阵相乘的算法,打破56年来的记录。

这不只是一个技术成就,更代表着AI开始能够协助人类探索未知的理论数学领域。
除了数学研究,AlphaEvolve也已被实际用于Google内部,例如:
为Borg系统设计更高效的资源调度算法
优化训练大型语言模型所用的矩阵乘法内核
改写TPU芯片内部运算逻辑
加速Transformer模型的注意力机制
这些应用横跨芯片、调度、AI训练与系统架构,凸显其“只要能程序化、能打分,就能优化”的广泛潜力。
DeepMind的研究员形容AlphaEvolve是一个“可编排、可扩展”的算法搜索框架,而不只是程序代码优化工具。就像AlphaGo让人类重新理解围棋的边界,AlphaEvolve也让我们意识到:那些看似稳定的数学知识,或许还远不及真相的冰山一角。

 楼主| 发表于 2025-5-27 14:20:41 | 显示全部楼层
太震撼了,有开发者代码实证后发现,谷歌AlphaEvolve的矩阵乘法突破,被证明为真!Claude辅助下,他成功证明,它果然仅用了48次乘法,就正确完成了4×4矩阵的乘法运算。接下来,可以坐等AlphaEvolve更「奇点」的发现了。
  就在刚刚,有人用Claude写代码证实——
  谷歌DeepMind的AlphaEvolve求解矩阵乘法的突破,100%正确!
  即使已经过去好几天,AI圈依然有许多人沉浸在这个AI的余震中。
  在时隔半个世纪(56年)后,AlphaEvolve将4×4的复数矩阵计算次数,从1969年Strassen的49次减少到了48次。
  
  这相当于百米世界纪录从9.58秒挤进9.57秒——虽然只有百分之一秒,却再一次刷新人类极限的认知。
  不过也有较真的人发出疑问了:AlphaEvolve这个发现保真吗?
  一位不信邪的开发者小哥,花了一整天时间,用代码来验证了一番。
  结果,他真的眼看着这个矩阵乘法突破的算法,在自己眼前运行了起来。那一刻,简直太震撼了!
  
  AlphaEvolve的巨大威力,果然诚不我欺。如今,就差一个值得AI发现的想法,然后输入进去等着它去验证了。
  现在,小哥已经发帖讲述了自己实证的具体过程,并在GitHub上上传了代码。
  开源Github证明,谷歌DeepMind说的没错  
  具体来说,怎么验证这个算法真的有效呢?
  小哥使用了Claude来帮忙。
  首先,他实现了标准矩阵乘法(64次乘法)和Strassen算法(49次乘法)。
  
  然后,他开始尝试用DeepMind论文中的张量分解,来实现AlphaEvolve算法。
  但第一次,他碰壁了。一开始测试时,结果完全不对,数值误差非常大。
  怎么办?小哥求助Claude后,它帮他理解了分解中使用的张量索引,并修复了实现中的问题。
  然后,他用Claude,自动将张量分解逆向工程,得出了直接的代码实现!
  
  而代码的各项指标,都令人喜出望外。
  无论是正确性、数值稳定性还是性能,各项指标都与Google论文中的官方报告保持一致!
  正确性(对实值与复值4 × 4 矩阵均能给出完全一致的结果)
  数值稳定性(经优化后误差控制在机器精度,约 10⁻¹⁶)
  性能(展平的直接实现速度领先原始张量式实现)
  甚至,为了得到更有说明意义的结果,小哥使用了澳大利亚国立大学的量子随机数生成器提供的量子随机矩阵,来测试所有算法!
  
  小哥上传GitHub的代码中,包括——
  各种矩阵乘法实现(标准版、Strassen、AlphaEvolve)
  一个张量分解分析器,用于反向解析算法
  使用量子随机数进行验证和基准测试的代码
  
    目睹这个过程的网友们,也赞叹道,谷歌AlphaEvolve实在是太划时代了。
  只是目前很多人还意识到,它的意义究竟有多重大,有多疯狂。
  
  所以,AlphaEvolve是怎样突破矩阵乘法难题的?
  硬的来了,矩阵乘法难题是怎么解决的  如果想了解这个过程,就需要首先理解AlphaEvolve解决的这个问题——4 × 4矩阵乘法的最小乘法次数。
  
  按照大一的「线性代数」,4 × 4 矩阵乘法按照传统的方法,需要64次乘法计算+48次加法运算
  
  其实很好理解,以矩阵a第一行和矩阵b第一列的计算生成结果矩阵c的第一个结果为例,需要4次乘法运算和3次加法:
  
  而结果矩阵依然是4×4,也就是16个元素,所以总得计算次数就是,64次乘法和48次加法。
  
  这种传统的办法被称为「标量乘法」,在硬件和能耗上远贵于加法,算法界把「减少乘法」当作衡量算法能力的第一指标。
  我们都知道,现代计算机计算,都是把所有运算最终转化为了二进制的加减法。
  如果能减少乘法运算次数,就能大大减少芯片最底层的开销。
  
  这是最基础的、最底层的数学科学研究,如果能取得突破,将极大的影响芯片运算,进而影响整个计算机生态。
  1969年,Strassen用两级递归将4 × 4矩阵乘法的计算从64减少到了49了,他是如何做到的?
  Strassen最早处理的是两个2×2矩阵相乘,传统方法2×2矩阵乘法要8次乘法。
  
  Strassen就想,既然结果C矩阵中每个数值都是类似「a*e+b*g」这样的排列组合,有没有能够减少乘法次数的办法?
  结果,还真的让他给想出来了!
  那就是「自定义」计算元素和序列,来组合出最终结果,如下图所示,比如设置M3=a*(f-h),M5=(a+b)*h。
  那么最终结果矩阵C中的「a*f+b*h」就能等价于M3+M5(简直太天才了!)
  
  于是整个传统的矩阵乘法就变成了上述的「自定义」计算模块的组合。
  这些模块中虽然加(减)法次数增多了,但是乘法次数从8次降低到了7次——从M1到M7个自定义模块,每个模块只有一次乘法!
  好了,现在2×2矩阵相乘中乘法次数降低了,那么4×4矩阵呢?
  Strassen接着说,如果一个4×4矩阵可以划分成4个2×2块,那就可以用刚才的方法来处理「块矩阵」。
  
  这下关键就来了,用Strassen方法来做每个2×2块的乘法(只需7次标量乘法),总乘法数将减少!
  这样,不论是A11、A12和B11这种内部划分后的「小块」,还是外部的大块都使用Strassen方法!
  Strassen在4×4矩阵里不是只用一次Strassen,而是继续对2×2块内部再用Strassen方法!
  Strassen再进一步递归:不是直接做8个2×2矩阵乘法(每个2×2里面是7次乘法),而是用「Strassen方法组合」来只做7次小矩阵乘法。
  最终,Strassen用两级递归做法:顶层用Strassen算法(做7次2×2小矩阵乘法),然后每个小矩阵再用Strassen算法(每个小矩阵需要7次标量乘法),所以最后只需要7×7=49!
  再次感叹,天才之作!
  Strassen将4×4标量乘法次数从64降到49,通过递归分解矩阵、使用「聪明」的加减组合,可以在保持结果正确的前提下,把原本的「傻算」乘法次数减少。
  这种「减少乘法」的思路,为之后几十年更快的矩阵乘法算法打下了基础。
  半个世纪以来,4×4矩阵的最小乘法一直都是49,再也没有新的算法出现。
  但是这次,谷歌的AlphaEvolve在自我进化中发现了新的答案!
  
  它是如何突破这个极限的?
  上面的例子解释了,想要发现新的「算法」,你就需要找到新的「自定义」计算模块,来尽可能减少乘法运算。1969年的Strassen通过「人工」的方式,找到了这个解。
  现在有了计算机,可以在数学上把矩阵乘法C=AB「升维」成张量线性操作的方式C=T·A·B。
  这样可以构造一个三阶张量T来「描述整个矩阵乘法计算图」,在这种张量表示下,张量T告诉你如何组合AB的元素来生成C的每一个元素。
  
  如果你能把张量T分解成如下形式,
  
  也就是把T表示为R个张量的加和(也就是
  
  )。
  DeepMind几年前就发明了AlphaTensor在TensorGame中的有限因子空间内找到张量分解。
  
  所以整个问题就变成了:用R次乘法操作来重建整个乘法过程!
  而AlphaEvolve的任务,就是找到这个最小的R。
  乘法次数「-1」  在实验中,AlphaEvolve总共测试了54种不同规模的矩阵乘法问题。这些规模大致涵盖了形如⟨𝑚,𝑛,𝑝⟩的情况,其中2≤𝑚,𝑛≤5,并对𝑝做了合理的截断。
  由于矩阵乘法张量本身具有对称性,对于三维轴的任意排列,存在等价的算法,因此只关注按顺序排列的规模,即𝑚≤𝑛≤𝑝。
  
  在所有情况下,AlphaEvolve提供的都是精确算法,分解中使用的是整数或半整数的系数。
  对于⟨3,4,7⟩、⟨4,4,4⟩和⟨4,4,8⟩这三种矩阵情况,AlphaEvolve发现的算法使用了复数乘法,这些算法可用于对复数矩阵或实数矩阵进行精确乘法运算。
  谷歌的研究人员说,他们当时并没有指望AlphaEvolve能知道比49次更好的方案,他们只是想要用AlphaEvolve来验证上述那张表格,来出个图。
  (原话是:我们就是希望画这张图,用来放在论文里,显得好看)
  没想到,AlphaEvolve给了他们莫大的惊喜!
  
  同时,谷歌提供了AlphaEvolve求解两个4×4矩阵相乘所对应的三维张量的Rank(可以简单理解为上述的乘法次数)为48的求解方法。
  
  
  
  而现在,谷歌研究者的结论,已经被开发者小哥确认:AlphaEvolve的算法的确有效!
  仅用48次乘法,就能正确地计算4×4矩阵的乘积,并且数值稳定性非常好,误差仅在10^-16(机器精度)量级。
  这实在是太振奋人心了。
  AlphaEvolve利用进化搜索 + LLM引导直接在三阶张量上找到低秩分解,乘法‑加法配比为48次乘法+183次加法。
  相比传统的64次乘法+48次加法,虽然加法次数变多,但是这对于计算机来讲都是小case,只要降低乘法次数,计算效率就能指数级提升。
  而和1969年的Strassen方法相比,AlphaEvolve的乘法次数「-1」,这一枚「‑1」不仅刷新了数学纪录,更象征AI‑for‑Science正在成为攻克深层数学难题的新范式。
  AI突破半个世纪矩阵乘法,研究员当场惊呆  在Youtube采访中,我们可以看到更多细节。
  就如上文所说,AlphaEvolve打破这项纪录,连谷歌DeepMind的研究者都没想到。
  
  对于通常情况下的矩阵,仍然没有比使用四十九次乘法进行两次Strassen更好的办法。
  
  
  开始,研究者们也压根没有期待它能找到更好的结果,因为他们已经用AlphaTensor尝试了很长时间了。
  结果,出乎所有人意料,一个更快的算法,居然被它发现了!
  这次,算法使用了48次,而不是49次乘法,彻底打破纪录。
  当看到一位同事发消息通知这一结果时,研究者表示自己简直不敢相信。
  反复检查三遍后,他们终于确认——
  AI不断增强的能力,可以生成全新的、可证明准确的算法,从而推动科学的边界!
  在专访中,当主持人问道:你可以举出一些系统做出真正有想象力的跳跃的例子吗?
  研究者举的例子,就是AlphaEvolve发现矩阵乘法算法的过程。
  实际上,他们只是让它设计了一个基于梯度的搜索算法,也即一个能找出的算法的算法,或者说元算法。
  第一个搜索算法,是从一个非常简单的代码框架开始的。
  研究者并未给它任何东西,只告诉它「用梯度」,然后,它就写出了这些复杂的损失函数和更新函数,而且以完全出人意料的方式引入了随机性。
  就在那一刻,研究者惊呼:太厉害了!
  当然,这种代码也有可能是人类写出的,但他们真的会想到写出这段特定代码吗?
  那一刻,他仿佛顿悟了——AlphaEvolve做的,是一些类似人类的事情,但又显然不是人类会尝试的东西。
  
  而哥大的算法设计助理教授Josh Alman也表示,AlphaEvolve似乎的确在产生新的想法,而不是在训练中学到的内容的重新组合。
  DeepMind研究者表示,他们有时会将一个算法的想法作为提示输入,从而产生有趣的新结果。
  这就提高了人类科学家和类AlphaZero系统合作的可能性。
  如今,AlphaEvolve可能是人类的一小步,但已经是AI的一大步。
  从AlphaGo、AlphaFold到AlphaEvolve,下一个Alpha,谷歌DeepMind还会给我们带来什么样的惊喜?

发表于 2025-5-27 17:29:48 | 显示全部楼层
看不懂
发表于 2025-6-4 07:53:01 来自手机 | 显示全部楼层
数学虐我千百遍
您需要登录后才可以回帖 登录 | 注册

本版积分规则

手机版|小黑屋|免费吧论坛

GMT+8, 2025-6-15 21:05 , Processed in 0.074421 second(s), 3 queries , Redis On.

Powered by Discuz! X3.5

© 2001-2025 Discuz! Team.

快速回复 返回顶部 返回列表