AI带来数学新发现学术资讯 - 科技工作者之家

作者：冯丽妃来源：中国科学报

英国谷歌深度思维公司的科学家利用一个大语言模型（LLM）对一个著名的数学问题作出了新发现，并通过系统的、迭代的评估框架确保正确。这一方法或可改进LLM用来解决问题和学习新知识的途径。相关研究近日发表于《自然》。

基于人工智能的工具（例如LLM）有望加速科学发现，解决长久存在的问题，但它们有时受制于“幻觉”，导致作出看似合理但错误的陈述。加入一个评估步骤，系统地衡量潜在解决方案的准确性，使得靠LLM帮助应对复杂问题成为可能。这些问题一般需要可验证且定义明确，使这一工具在数学科学中有潜在价值。

谷歌深度思维公司的Alhussein Fawzi和同事介绍了一种方法，称为FunSearch，将一组产生创造性解决方案的LLM和一个作为检查者以避免错误建议的评估程序结合起来。他们通过一个多次迭代此过程的演化方法，提供此前最佳解决办法作为输入来引导LLM，结果表明这种方法可以收敛到新的、可验证的正确结果。他们将FunSearch应用到了著名的上限集问题（cap set problem，数学中涉及计数和排列领域的一个中心问题），发现了超越最著名上限集的大上限集新构造。

研究者表示，FunSearch的成功关键是它会寻找描述如何解决一个问题的程序，而非寻找解决办法。因为FunSearch的结果是程序，结果易于人类解释和验证，这意味着该方法有望激发该领域的进一步思考。他们补充说，这个方法可能还不适合所有类型的挑战，但提出未来改进或可使FunSearch应用于更大范围的问题。

相关论文信息：https://doi.org/10.1038/s41586-023-06924-6