首页 > 人工智能 >首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

来源:ithome 2025-09-11 15:40:16

xiayx 9月10日消息,英伟达今日宣布推出新产品 Rubin CPX,这是一款专为大规模上下文处理而设计的专用 GPU,涵盖了像大规模编码和生成视频这样要求高的工作。

该硬件旨在将理解 AI 提示的任务与生成响应的任务区分开,英伟达表示,这将使整个过程对客户的效率更高。

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

该新硬件预计将作为较大的 Vera Rubin 平台的一部分工作,该平台同时集成了 Vera CPU 和 Rubin GPU。英伟达声称全机架版本 Vera Rubin NVL144 CPX 拥有 8 exaflops 的 AI 性能。

首款专为大规模上下文 AI 设计的 CUDA GPU,英伟达 Rubin CPX 发布

xiayx从英伟达新闻稿获悉,独立的 Rubin CPX GPU 包含 128GB 的 GDDR7 显存。英伟达承诺,新硬件具有 3 倍的 attention capabilities,并使用公司的 4-bit NVFP4 精度提供 30 petaflops 的计算能力。

英伟达 CEO 黄仁勋将 Rubin CPX 与 RTX 进行了比较,他说:“正如 RTX 革新了图形和物理 AI,Rubin CPX 是首款专为大规模上下文 AI 设计的 CUDA GPU,能够在同一时间推理跨越数百万个知识符号的模型。”他还试图量化客户的投资回报,提到部署新硬件的 1 亿美元投资可以产生 50 亿美元的收益。

英伟达表示,该硬件将得到其完整软件栈的支持,包括 Nemotron —— 其一系列开放的多模态模型,专为构建企业级 AI 代理(旨在自主处理复杂任务的系统)而设计。Nemotron 模型提供不同尺寸,从 Nano 用于设备端应用,到 Super 用于单 GPU 设置,再到 Ultra 用于大型数据中心。

英伟达表示,预计 Rubin CPX 将于 2026 年底推出。

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

热游推荐

更多
湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。