首页 > 人工智能 >陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

来源：ithome 2025-10-04 20:30:10

AI 又又又帮陶哲轩解决了一个难题！

消息来自陶本人最新发帖，他直言不讳地表示：

长期稳定更新的攒劲资源： >>>点此立即查看<<<

如果没有 AI 帮忙，完成同样任务就需要花费数小时（主要是手动编写代码和调试）。

甚至，如果没有 AI，他也不会决定采用目前已经取得成功的关键策略。

事实上，如果没有 AI 帮忙，我几乎不可能尝试进行这种数值搜索（可能会寻求理论渐近分析）。

陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

由于用的是 GPT-5，OpenAI 研究员 Sebastien Bubeck（微软前 AI 副总裁 & 杰出科学家）也火速转发了一波，由此在??社区引发热烈讨论。

陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

除了纷纷回忆和陶神本人类似的经历，网友们无不感慨：

这标志着我们正在进入一个人类与机器共同探索的新时代。

陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

所以，陶哲轩这次用 AI 解决了什么问题？AI 又在其中起了多大作用？

咱接着康康 ——

仅用 29 行 Python 代码帮助验证结果

陶哲轩这次要解决的是 MathOverflow（专业数学问答社区）上的一个问题：

序列 lcm (1,2,…,n) 是否是高度丰数的一个子集？

陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

简单来说，这个问题其实就是在比对两个特殊的数列。

一个是最小公倍数数列，如：

n=2，lcm(1,2）=2

n=3，lcm(1,2,3）=6

n=4，lcm(1,2,3,4）=12

n=5，lcm(1,2,3,4,5）=60

……

另一个是高度丰数数列 Highly Abundant Numbers (HA)。这类数有个特殊性质：其“所有约数加起来的和”，比任何比它小的数都大。

例如 1 的约数和是 1，2 的约数和是 3（大于 1），4 的约数和是 7（比 3、1 都大），所以它们是高度丰数。

由于发现前面算出来的最小公倍数们，居然刚好也是高度丰数，所以问题来了 —— 会不会所有的最小公倍数，永远都在高度丰数的行列里？（即子集）

陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

对于这个问题，陶哲轩之前已经通过理论分析，得出答案是否定的。

不过要想完全证明这一点，还需要找到具体的数值参数，以便确凿地构建一个反例。

虽然方向很明确，但陶哲轩清楚，由于过程中需要繁琐的计算和参数搜索，所以这也算是一项“大工程”，人工就得吭哧吭哧干几小时。

而交给 GPT-5 后，一切都变得轻松了…… 仅通过自然语言对话，几轮沟通下来 AI 就帮忙解决了问题。

具体过程如下：

起初，陶哲轩尝试让 GPT-5 直接生成 Python 程序，来搜索这些反例的参数。

这样陶就可以自己跑代码、调整参数。

GPT-5 在思考了大约 1 分钟 19 秒后，也确实给出了一段很长的代码。

陶哲轩用 GPT-5 解决数学难题：仅 29 行 Python 代码

但实际运行后发现，生成的代码运行时间过长，且初始参数选择不当，最终会导致搜索的失败。

于是他选择转变策略，通过与 GPT-5 展开分步对话，来让它通过启发式计算来寻找可行的参数选项。

换句话说，他选择将一个大问题拆成多个小问题，然后在其本人的指导下，让 GPT-5 来逐个攻破。

几轮沟通下来，GPT-5 终于成功生成了符合要求的参数。

并且，为了确保结果可靠，陶还使用了由 GPT-5 生成的拥有 29 行代码的 Python 脚本进行独立验证。

在陶看来，这个脚本简洁明了，易于人工检查，且验证的数值结果与之前的启发式预测完全吻合。

frommathimportlogn=200000;_jarethefirst25consecutiveprimesstartingat1.05*sqrt(n)p=[479,487,491,499,503,509,521,523,541,547,557,563,569,571,577,587,593,599,601,607,613,617,619,631,641]_mfoundbythesearch(13primes)q=[187963,187973,187987,188011,188017,188021,188029,188299,199931,199933,199961,199967,199999]sum_log_p=sum(log(x)forxinp)sum_log_q=sum(log(x)forxinq)termssum_corr_p=sum(log(1.0+1.0/(x*(x+1)))forxinp)sum_corr_q=sum(log(1.0+1.0/x)forxinq)gap_q_minus_p=sum_log_q-sum_log_prhs_budget=sum_corr_p-sum_corr_qprint(f"sum_log_q-sum_log_p={gap_q_minus_p:.12g}")print(f"RHSbudget={rhs_budget:.12g}")print("Inequality(correctsign)holds?:",(gap_q_minus_p&gt;0)and(gap_q_minus_p&lt;rhs_budget))youwantedthesitesign,thisiswhatyou'dbechecking:gap_p_minus_q=-gap_q_minus_pprint(f"\nsum_log_p-sum_log_q={gap_p_minus_q:.12g}")print("Inequality(sitesign)holds?:",(gap_p_minus_q&gt;0)and(gap_p_minus_q&lt;rhs_budget))

综上，通过使用 GPT-5，陶哲轩最终完成了上述问题的否定证明。

而且他还特意提到，面对数学这类严肃课题，AI 这次竟然也没有犯幻觉这个“老毛病”。