首页 > 人工智能 >字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

来源:ithome 2025-12-24 12:31:39
感谢xiayx网友 若怡 的线索投递!

xiayx 12月24日消息,字节跳动 Seed 团队今日宣布推出新一代形式化数学推理专用模型 Seed Prover 1.5,通过大规模的 Agentic RL 训练,其推理能力和推理效率宣称取得显著进步。

相比上一代模型,Seed Prover 1.5 在 16.5 小时内,针对 IMO 2025 的前 5 道题目生成了完整可编译验证的 Lean 证明代码,换算成绩为 35/42,达到此前 IMO 评分标准的金牌分数线。

长期稳定更新的攒劲资源: >>>点此立即查看<<<

针对北美本科级别数学竞赛 Putnam,Seed Prover 1.5 用时 9 小时,对 12 道 Putnam 2025 赛题中的 11 道生成了可编译验证的 Lean 代码。

更系统的评估中,Seed Prover 1.5 在完整的 Putnam 历史评估集上解决了 88% 的问题,在代表硕士数学难度的 Fate-H 和代表博士生数学难度的 Fate-X 评估集上,分别解决了 80% 和 33% 的问题,刷新了形式化数学推理模型在这几个评测集上的 SOTA 表现。

字节跳动发布新一代形式化数学推理专用模型 Seed Prover 1.5

Seed Prover 1.5 的技术报告已对外公开,官方后续将开放 API,xiayx附链接如下:

技术报告:

https://arxiv.org/abs/2512.17260

Lean 证明代码:

https://github.com/ByteDance-Seed/Seed-Prover/blob/main/SeedProver-1.5/Putnam2025.zip

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。