自古以来,算法在数学领域中扮演着重要角色,助力数学家们进行基本运算。古埃及人开创了无需乘法表的乘积计算方法,而欧几里得则留下了计算最大公约数的经典算法。在文化繁荣的年代,花拉子米提出了求解线性及二次方程的新途径。尽管现今我们对算法已相当熟悉,但发现新的算法仍然充满挑战。
近期,一篇发表于《自然》杂志的研究揭示了DeepMind团队所开发的突破性人工智能系统——AlphaTensor。该系统专为发现高效且经证实正确的基本算法而设计,如矩阵乘法。
矩阵乘法:核心运算
矩阵乘法是代数中最为基础的运算之一,对现代数字世界产生巨大影响。两个3×3矩阵相乘的例子已在DeepMind的研究中展示。
矩阵乘法是多种应用的核心,从智能手机图像处理到语音指令识别,从电脑游戏图像生成到复杂物理学的模拟。可以说,矩阵乘法无处不在,深入我们日常生活的方方面面。
在过去的世纪里,数学家们普遍认为矩阵乘法的标准算法是最优的。在1969年,沃尔克·施特拉森提出了更高效的算法——施特拉森算法。
施特拉森算法的启示
施特拉森算法虽然需要更多的加法步骤,但因计算机进行加法远快于乘法,因此这种算法的实用性得到认可。
DeepMind的研究团队不满足于现状,他们借助现代人工智能技术,自动探寻新的矩阵相乘算法。他们发现了一种在当前硬件上运行更快的算法。
游戏化寻找算法
DeepMind团队将寻找有效矩阵乘法算法的问题转化为一个名为TensorGame的三维棋盘游戏。在这个游戏中,棋盘代表待解决的乘法问题,每一步棋都是解决问题的方法。
玩家通过允许的移动来调整张量,目标是使张量中的所有数字在最少的步骤内归零。这一挑战极具难度,因为每一步都需要从数以万亿计的选项中选择。
为了应对这一挑战,团队开发了关键组件,包括新的网络架构、生成合成数据的程序以及利用问题对称性的配方。AlphaTensor智能体通过强化学习的方式进行训练。
超越人类认知的发现
AlphaTensor不仅重新发现了已知的最佳算法,还超越了人类的认知界限,发现了更快的算法。在计算4x5矩阵相乘时,AlphaTensor发现的算法减少了所需的乘法次数。
该系统在超过70种不同大小的矩阵上测试了其性能。例如,它减少了两个9×9和11×11矩阵相乘所需的步数。它在有限域内对施特拉森二阶算法进行了改进。
拓展算法研究空间
AlphaTensor发现的算法展示了算法空间的丰富性。利用这种多样性,研究人员能够针对特定硬件寻找高效的算法。
未来的研究与影响
复杂性理论的研究因新的发现而得以进一步推进。AlphaTensor不仅提升了我们对矩阵乘法算法多样性的理解,还可能为确定计算机科学中最基本的开放问题之一——矩阵乘法的渐近复杂性提供新的线索。
鉴于矩阵乘法在计算机图形学、数字通信、网络训练和科学计算等领域的核心地位,AlphaTensor的发现有望大大提高这些领域的计算效率。
DeepMind团队希望,未来更多的人能利用人工智能解决数学和科学领域的挑战。