
1月14日,清华大学自然语言处理实验室联合中国人民大学、面壁智能及OpenBMB开源社区共同发布智能体模型AgentCPM-Explore。该模型参数规模仅为40亿,具备在终端设备部署的潜力,有望推动大模型在长程任务处理场景中的轻量化应用。
长期稳定更新的攒劲资源: >>>点此立即查看<<<
在多项智能体评测基准测试中,包括GAIA、HLE、Browsercomp及其中文版本、WebWalker、FRAMES、Xbench-DeepResearch以及Seal-0等,AgentCPM-Explore展现出优异的参数效率。其性能不仅达到同级别模型中的领先水平,更在多个指标上接近或超越参数量达80亿的先进模型,部分表现可与300亿以上参数乃至闭源大模型相媲美。
特别是在Xbench-DeepResearch测评中,该模型的表现优于OpenAI-o3、Claude-4.5-Sonnet等闭源系统,突破了现有不同规模模型性能趋势线,体现出更高的能力密度。
此次发布的AgentCPM-Explore模型已全面开源,同步公开从基础模型(GAIA得分25.24%)迭代优化至领先水平模型(GAIA得分63.90%)的完整训练与演进代码流程,旨在促进智能体技术的开放研究与持续发展。
相关代码与模型已发布至开源平台,供开发者与研究人员使用。
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述