首页 > 手游评测 >英伟达新卡跑AI吊打4张5090!功耗还更低

英伟达新卡跑AI吊打4张5090!功耗还更低

来源:互联网 2026-04-23 17:24:18

高端单卡逆袭:当RTX Pro 6000 Blackwell接近四张RTX 5090 最近行业里有个讨论挺有意思:跑大模型,是不是卡越多就一定越好?外媒的一份测试报告,或许能给我们带来一些新视角。测试聚焦于NVIDIA新推出的专业级显卡RTX Pro 6000 Blackwell,结果发现,在处理大

高端单卡逆袭:当RTX Pro 6000 Blackwell接近四张RTX 5090

最近行业里有个讨论挺有意思:跑大模型,是不是卡越多就一定越好?外媒的一份测试报告,或许能给我们带来一些新视角。测试聚焦于NVIDIA新推出的专业级显卡RTX Pro 6000 Blackwell,结果发现,在处理大型AI模型时,一张顶级单卡的表现,有时比主流的多卡方案还要高效,其性能甚至能逼近四张消费级旗舰RTX 5090。

测试选用了参数高达2300亿的MiniMax M2.7模型,并在统一的IQ3_XXS量化、32K上下文长度和4096最大token生成设置下进行。对比了四种硬件配置:

长期稳定更新的攒劲资源: >>>点此立即查看<<<

4×NVIDIA GeForce RTX 4090(96GB显存):生成速度71.52 tok/s,首token延迟(TTFT)1045ms

4×NVIDIA GeForce RTX 5090(128GB显存):生成速度120.54 tok/s,TTFT 725ms

1×NVIDIA RTX Pro 6000 Blackwell(96GB显存):生成速度118.74 tok/s,TTFT 765ms

NVIDIA DGX Spark(128GB显存):生成速度24.41 tok/s,TTFT 741ms

英伟达新卡跑AI吊打4张5090!功耗还更低

从生成速度这个核心指标看,结果一目了然。单张RTX Pro 6000几乎追平了四张RTX 5090的组合,同时明显领先于四张RTX 4090。而DGX Spark由于其特定的集成化与能效定位,性能表现是另一条赛道。

不过,故事到这里才讲了一半。性能接近固然惊人,但真正的“杀手锏”往往藏在功耗表里。来看看这组数据:

4×RTX 4090:整机功耗约1800W

4×RTX 5090:整机功耗约2300W

单张RTX Pro 6000:功耗约600W

DGX Spark整机:功耗约240W

这意味着什么?简单算一笔账:RTX Pro 6000仅用了四张RTX 5090大约四分之一的功耗,就实现了近乎同等的性能。对于需要长时间、高负载运行AI任务的数据中心或研究机构而言,这背后的电费成本和散热压力差异,可不是个小数目。

英伟达新卡跑AI吊打4张5090!功耗还更低

当然,采购成本也是必须考量的现实因素。我们来粗略看一下市场报价:

单张RTX 4090:约3000美元

单张RTX 5090:约3500美元(四张总计约14000美元)

单张RTX Pro 6000 Blackwell:约9500美元

DGX Spark整机:约4699美元

综合来看,这张测试图景揭示了一个越来越清晰的趋势:多卡并联虽然能简单粗暴地叠加显存容量,但随之而来的通信开销、延迟增加以及效率损失也不容忽视。相反,配备超大显存的顶级单卡,在性能、功耗与总拥有成本(TCO)之间找到了一个更优雅的平衡点。尤其是在运行参数量庞大的尖端AI模型时,其“一体化”的优势——更低的内部延迟、更高的能效比——就变得格外突出。这对于追求极致效率与稳定性的专业场景来说,无疑提供了一个值得深思的新选项。

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

相关攻略

更多

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。