首页 > 新闻资讯 >Gemini-3-pro登顶多模态评测,豆包、Qwen3-vl展现中国AI实力

Gemini-3-pro登顶多模态评测,豆包、Qwen3-vl展现中国AI实力

来源:林有三 2026-01-01 05:16:44

Gemini-3-pro登顶多模态评测,豆包、Qwen3-vl展现中国AI实力

2025年12月31日,最新发布的多模态视觉语言模型综合能力评测结果揭晓。在本次测评中,谷歌研发的Gemini-3-pro以83.64分的成绩位居首位,展现出强劲的技术实力。字节跳动推出的豆包大模型获得73.15分,位列榜单前三,体现了国内企业在多模态人工智能领域的快速进步。

长期稳定更新的攒劲资源: >>>点此立即查看<<<

本次评估从基础认知、视觉推理和视觉应用三个层面全面考察各模型的表现。Gemini-3-pro在三项指标中均取得领先,分别获得89.01分、82.82分和79.09分,整体性能优势明显。

在国内模型中,商汤科技的SenseNova V6.5 Pro以75.35分排名靠前,紧随其后的是豆包视觉版。该版本在基础认知方面表现优异,得分达到82.70,优于部分国际同类产品,仅在视觉推理环节略有不足。

此外,百度研发的ERNIE-5.0-Preview与阿里巴巴推出的Qwen3-vl也进入前五名。其中,Qwen3-vl成为本次榜单中唯一一个总分突破70分且开放源代码的模型,显示出较高的技术透明度与社区支持潜力。

在国际主流模型中,Anthropic公司开发的Claude-opus-4-5获得71.44分,而OpenAI的GPT-5.2(high)得分为69.16分,排名处于中下游位置。评测结果显示,当前多模态模型竞争格局正持续演变,国内外技术差距逐步缩小,多个本土模型已在关键能力上具备全球竞争力。

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

相关攻略

更多

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。