首页 > web3 >黄仁勋回应AI竞争格局:否认“依赖Anthropic养活芯片业务”,强调英伟达与谷歌、亚马逊深度协同

黄仁勋回应AI竞争格局:否认“依赖Anthropic养活芯片业务”,强调英伟达与谷歌、亚马逊深度协同

来源:互联网 2026-04-23 09:38:29

文 | 产联社CLS 2026年4月,黄仁勋西装袖口上似乎还沾着达沃斯雪粒的微尘,转眼便已站在GTC大会的聚光灯下。他的手指划过全息投影里不断延展的算力地图,语速不疾不徐,但每个停顿都像在精密的焊点上落下一滴锡——稳、准,且带着金属冷却后的余温。 然而,就在4月15日,硅谷一间没有专业打光的播客录音

文 | 产联社CLS

黄仁勋回应AI竞争格局:否认“依赖Anthropic养活芯片业务”,强调英伟达与谷歌、亚马逊深度协同

虚拟币交易推荐使用币安交易所进行交易

苹果用户和电脑端用户也可以直接进入币安官网下载:点击访问币安官网下载注册

安卓用户可以直接下载币安安装包:点击下载币安安装包

2026年4月,黄仁勋西装袖口上似乎还沾着达沃斯雪粒的微尘,转眼便已站在GTC大会的聚光灯下。他的手指划过全息投影里不断延展的算力地图,语速不疾不徐,但每个停顿都像在精密的焊点上落下一滴锡——稳、准,且带着金属冷却后的余温。

然而,就在4月15日,硅谷一间没有专业打光的播客录音室里,气氛截然不同。主持人Dwarkesh Patel刚将话筒向前推了两厘米,黄仁勋便摘下了那副标志性的黑框眼镜,镜片朝下轻扣在桌沿,发出一声细微的脆响。

接下来的113分钟,没有提词卡,没有预设的转折,也听不到那句常见的“正如我们之前所说”。谈及TPU时,他的嘴角向下压了半秒;说到出口管制,右手食指突然叩击桌面三次;讲到Groq芯片的响应延迟,他忽然抬起左手,在空中切出一个不到0.3秒的弧线——仿佛在精准截断某个正在生成的token。

他没有谈论“英伟达的护城河”,也没有重复“长期战略愿景”。他给出的定义更为直接:“我们销售的并非GPU本身,而是电子进去、token出来的转化率。”

电子进去,token出来

一个尖锐的问题被抛了出来:如果AI服务真的像水电煤一样成为基础设施,那么芯片是否会沦为管道工手中千篇一律的扳手?

他摇了摇头,随即指向桌上那杯刚续满的咖啡,打了个比方:“看看这杯水。电力是水源,散热系统是水塔,芯片互连是主干管道,编译器是控制流量的水压阀。而token……则是每一滴从喷嘴射出、带有特定旋转角动量的水珠。”

他稍作停顿,补充道:“你可以拧紧阀门来节约用水,但无法让水珠自己学会绕开障碍物。”

这恰恰解释了英伟达的专注点。工厂从不生产整机,而是全力打磨最深层的技术沟槽——无论是Hopper架构里那条仅0.8微米宽的NVLink通道,Blackwell中被压缩到单周期即可完成的FP4乘加单元,还是正在流片的Rubin架构中,为高效token调度专门蚀刻的异步仲裁环。至于其余部分?大可以交给台积电的晶圆厂、富士康的组装线、Meta的数据中心工程师,甚至是中国深圳华强北某家专做PCIe转接卡的小作坊。只要数据流通的核心通路必须经过英伟达定义的协议栈,其影响力便始终贯穿于产业链的每一个环节。

当采购承诺金额跃升至987亿美元那天,黄仁勋正站在凤凰城新建的液冷测试场内。墙上没有悬挂财报图表,只钉着一张字迹潦草的泛黄便签:“水管工比光刻机更难招——明年GTC,请他们坐前排。”

后来他认真地补充道:“这并非玩笑。上周我审阅了三份亚利桑那州电网扩容方案,其认真程度,甚至超过了研究A100的功耗曲线。”

若非Anthropic,TPU增长为0

话题转向定制芯片时,他身体微微前倾,衬衫的第三颗纽扣略显紧绷:“谷歌的TPU v6?运行ResNet-50这类固定任务确实很快。但若让它去跑今天凌晨刚开源的Llama-4-MoE-128K模型呢?它恐怕得先等编译器团队重写三周代码。”

他敲了敲桌面,总结道:“过度专用化,无异于将门焊死在当前的墙上。而AI这面墙,每年都在以十米的速度向上增长。”

随后,他忽然陷入沉默,整整六秒。录音笔的红色指示灯在寂静中稳定闪烁。

“OpenAI第一次来找我谈H100订单时,我让他们等了三个月。”他的声音低沉下来,“当Anthropic发来第一封架构咨询邮件,我只回复了‘稍后’。现在回头再看——那个‘稍后’,几乎等同于‘永远错过’。”

他抬起眼,目光锐利:“他们缺的并非资金,而是治疗‘算力饥渴症晚期’的处方药。而我当时,竟误以为那只是场普通感冒。”

对出口管制的反驳

当主持人刚提及“中国AI发展可能威胁国家安全”这个短语时,黄仁勋直接打断了对话:“核武器?核武器可不会自己改写代码。”

他伸手拿过平板电脑,调出一张全球AI论文作者地理分布热力图。红色最浓的区域覆盖了长三角、京津冀和粤港澳大湾区,旁边标注着一行醒目的数据:2025年第四季度,中国高校获得的AI专利授权量高达47,281件。

“限制措施瞄准的是芯片,但催生出的却是全新的指令集。限制的是NVLink带宽,却逼出了CXL over RDMA这类替代方案。限制A800的销售,结果对方用768块昇腾910B,搭建出了等效于2000块H800的算力集群——而且,所有底层的调度逻辑,如今依然运行在我们编写的CUDA-X库之上。”他分析道。

他直视着镜头,抛出一个值得深思的预警:“真正的风险,或许不在于中国能否造出芯片。而在于三年之后,当全球83%的AI推理请求自动路由到非x86架构时,甚至连PyTorch的默认后端,都可能已悄然切换到了昆仑芯的指令集。”

token要分等级

最后谈到Groq,他并未讨论收购金额,而是打开手机相册,展示了一张照片:Groq LPU芯片表面的放大图,上面密布着24条独立的token发射通道,每条通道旁都蚀刻着代表不同计算精度的浮点标尺。

“过去的芯片厂商都在押注——哪一个模型架构会最终胜出。但现在,这场反赌已经过时了。”他的指尖划过屏幕,解释道,“工程师需要的不是‘能生成’,而是‘在IDE光标第七次闪烁之前生成’。投行分析师要的不是‘答案正确’,而是‘比彭博终端快0.4秒给出套利窗口’。这些需求,早已不在同一个性能象限之内。”

他合上手机,总结道:“Groq的芯片产量,或许只有我们一条产线的两百分之一。但它的价值在于,第一次为‘token’这个词贴上了明确的价格标签——不是按照token的数量,而是按照token抵达人类视网膜的时间差来计价。”

录音结束前,他对着麦克风说了最后一句话,没有看提词器,也未调整坐姿:“三十年前,我和张忠谋在台积电新竹厂一起吃盒饭。他递给我一双无尘手套,说,‘Jensen,别碰晶圆,但可以触碰未来’。如今,我只想确保一件事——所有通往未来的电流,都必须先经过我们刻下的那道沟槽。”

文章信息来源:Jensen Huang – Will Nvidia’s moat persist Dwarkesh Patel,YouTube

侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述

湘ICP备14008430号-1 湘公网安备 43070302000280号
All Rights Reserved
本站为非盈利网站,不接受任何广告。本站所有软件,都由网友
上传,如有侵犯你的版权,请发邮件给xiayx666@163.com
抵制不良色情、反动、暴力游戏。注意自我保护,谨防受骗上当。
适度游戏益脑,沉迷游戏伤身。合理安排时间,享受健康生活。