首页 > 手游评测 >英伟达新卡跑AI吊打4张5090！功耗还更低

英伟达新卡跑AI吊打4张5090！功耗还更低

来源：互联网 2026-04-23 17:24:18

高端单卡逆袭：当RTX Pro 6000 Blackwell接近四张RTX 5090 最近行业里有个讨论挺有意思：跑大模型，是不是卡越多就一定越好？外媒的一份测试报告，或许能给我们带来一些新视角。测试聚焦于NVIDIA新推出的专业级显卡RTX Pro 6000 Blackwell，结果发现，在处理大

高端单卡逆袭：当RTX Pro 6000 Blackwell接近四张RTX 5090

最近行业里有个讨论挺有意思：跑大模型，是不是卡越多就一定越好？外媒的一份测试报告，或许能给我们带来一些新视角。测试聚焦于NVIDIA新推出的专业级显卡RTX Pro 6000 Blackwell，结果发现，在处理大型AI模型时，一张顶级单卡的表现，有时比主流的多卡方案还要高效，其性能甚至能逼近四张消费级旗舰RTX 5090。

测试选用了参数高达2300亿的MiniMax M2.7模型，并在统一的IQ3_XXS量化、32K上下文长度和4096最大token生成设置下进行。对比了四种硬件配置：

长期稳定更新的攒劲资源： >>>点此立即查看<<<

4×NVIDIA GeForce RTX 4090（96GB显存）：生成速度71.52 tok/s，首token延迟（TTFT）1045ms

4×NVIDIA GeForce RTX 5090（128GB显存）：生成速度120.54 tok/s，TTFT 725ms

1×NVIDIA RTX Pro 6000 Blackwell（96GB显存）：生成速度118.74 tok/s，TTFT 765ms

NVIDIA DGX Spark（128GB显存）：生成速度24.41 tok/s，TTFT 741ms

英伟达新卡跑AI吊打4张5090！功耗还更低

从生成速度这个核心指标看，结果一目了然。单张RTX Pro 6000几乎追平了四张RTX 5090的组合，同时明显领先于四张RTX 4090。而DGX Spark由于其特定的集成化与能效定位，性能表现是另一条赛道。

不过，故事到这里才讲了一半。性能接近固然惊人，但真正的“杀手锏”往往藏在功耗表里。来看看这组数据：

4×RTX 4090：整机功耗约1800W

4×RTX 5090：整机功耗约2300W

单张RTX Pro 6000：功耗约600W

DGX Spark整机：功耗约240W

这意味着什么？简单算一笔账：RTX Pro 6000仅用了四张RTX 5090大约四分之一的功耗，就实现了近乎同等的性能。对于需要长时间、高负载运行AI任务的数据中心或研究机构而言，这背后的电费成本和散热压力差异，可不是个小数目。

英伟达新卡跑AI吊打4张5090！功耗还更低

当然，采购成本也是必须考量的现实因素。我们来粗略看一下市场报价：

单张RTX 4090：约3000美元

单张RTX 5090：约3500美元（四张总计约14000美元）

单张RTX Pro 6000 Blackwell：约9500美元

DGX Spark整机：约4699美元

综合来看，这张测试图景揭示了一个越来越清晰的趋势：多卡并联虽然能简单粗暴地叠加显存容量，但随之而来的通信开销、延迟增加以及效率损失也不容忽视。相反，配备超大显存的顶级单卡，在性能、功耗与总拥有成本（TCO）之间找到了一个更优雅的平衡点。尤其是在运行参数量庞大的尖端AI模型时，其“一体化”的优势——更低的内部延迟、更高的能效比——就变得格外突出。这对于追求极致效率与稳定性的专业场景来说，无疑提供了一个值得深思的新选项。

侠游戏发布此文仅为了传递信息，不代表侠游戏网站认同其观点或证实其描述