作者:Ada,深潮 TechFlow 在美国旧金山的圣何塞会议中心,英伟达GTC大会现场。 英伟达首席科学家比尔·戴利与谷歌的杰夫·迪恩正在进行一场对话。期间,戴利提及一个具体数据:“过去,要将一个包含约2500至3000个单元的标准单元库移植到新工艺,需要一支8人工程师团队,花费近10个月时间。”
作者:Ada,深潮 TechFlow
在美国旧金山的圣何塞会议中心,英伟达GTC大会现场。
虚拟币交易推荐使用币安交易所进行交易
苹果用户和电脑端用户也可以直接进入币安官网下载:点击访问币安官网下载注册
安卓用户可以直接下载币安安装包:点击下载币安安装包
英伟达首席科学家比尔·戴利与谷歌的杰夫·迪恩正在进行一场对话。期间,戴利提及一个具体数据:“过去,要将一个包含约2500至3000个单元的标准单元库移植到新工艺,需要一支8人工程师团队,花费近10个月时间。”
他稍作停顿。
“现在,只需要一张GPU,运行一个晚上。”
台下并未出现惊呼,因为理解这句话含义的人都明白其背后的分量。八个人十个月的工作量,被一颗自家生产的GPU在一夜之间完成。戴利还补充说,自动化工具产出的结果,在面积、功耗和延迟这三个关键指标上,已经能够达到甚至超越人类设计师的水平。
次日,相关新闻的标题被解读为“英伟达用AI设计GPU”。
但实际情况,远比这个标题所概括的更为复杂和深刻。
英伟达内部运行的并非不可解释的“黑箱”系统,而是几套经过多年打磨的专用工具链。
NB-Cell是一个基于强化学习的程序,专门攻克标准单元库迁移这类繁重的基础工作。它不生成文档,也不汇报进度,只在特定时间将新版单元布局推送给设计工程师。其生成的布局可能在晶体管堆叠角度等细节上与人类方案不同,但能在总线电容、时序收敛等关键指标上实现优化。
Prefix RL则旨在解决进位前瞻链中前瞻阶段的放置这一长期难题。戴利表示,该系统生成的布局“是人类永远无法想到的”,与人类设计相比,关键指标提升了约20%到30%。它不解释具体决策过程,但能给出达到理论极限附近性能的结果。
此外,还有两个内部大型语言模型:Chip Nemo和Bug Nemo。英伟达将历史上多代GPU的RTL代码、架构文档、设计规格乃至部分开发记录都输入给这些模型。按照戴利的描述,这相当于将公司过去二十年的工程经验“蒸馏”成了一个内部模型。新员工可以通过它快速获取资深工程师的知识。
那么,这是否意味着“AI可以独立设计GPU”了呢?
恰恰相反。戴利明确表示:“我很希望有一天能直接说‘给我设计一颗新GPU’,但我们离那一步还很远。”
英伟达并未用AI直接设计出完整的GPU。但它所做的另一件事,可能让整个芯片设计行业在未来都难以离开它。
2025年12月1日,英伟达以20亿美元入股电子设计自动化三巨头之一的新思科技。双方签署了联合开发协议,计划将英伟达的加速计算栈嵌入新思科技的整个EDA工作流,其Blackwell及下一代Rubin GPU将与新思科技的Synopsys.ai平台进行深度整合。
新思科技的地位需要简要说明。全球绝大多数先进制程芯片,在设计阶段都依赖于新思科技或楷登电子的工具链。这两家公司与西门子EDA共同构成了芯片设计底层工具的基石。你可以选择不同的芯片或代工厂,但很难完全避开这些EDA工具。
入股新思科技之后三个月,英伟达又将楷登电子、西门子、达索系统纳入合作阵营,宣布它们都在基于英伟达GPU开发AI驱动的芯片设计工具。
英伟达公布的基准测试数据显示了显著的加速效果:新思科技的PrimeSim在Blackwell上提速30倍,Proteus提速20倍;联发科使用H100将楷登电子的Spectre提速6倍;Astera Labs采用新思科技与英伟达的方案,将芯片验证速度提升3.5倍。
一个值得关注的细节是:楷登电子的Millennium M2000平台,被标注为“专为EDA市场打造,独家基于英伟达Blackwell架构”。
“独家”二字意味深长。这意味着,过去EDA工具可以运行在多种计算平台上,英特尔、AMD等都能参与竞争。而未来,想要使用性能最强的EDA工具,可能必须购买英伟达的GPU。这从“推荐配置”变成了某种意义上的“必要路径”。
普遍理解的英伟达商业飞轮是:向人工智能公司销售GPU,用于训练大模型;大模型的成功反过来证明GPU的不可或缺性,从而吸引更多购买。
这个飞轮已经非常强大。但在其之下,还存在更深一层。
英伟达利用自身的AI工具设计下一代GPU,将设计效率拉开代际差距,同时将整个行业的EDA工具链与自家硬件深度绑定。竞争对手想要追赶,却发现连追赶所需的先进工具都日益依赖于英伟达的生态。
超威半导体公司近期财报所反映的市场焦虑,部分正源于此。尽管英伟达和新思科技表面上声称“投资不附带任何采购英伟达硬件的义务”,但市场清楚,加速版EDA功能的首发和优化平台很可能优先基于英伟达硬件。这就像锻造利刃所需的最好淬火炉,掌握在竞争对手手中。
不妨设想,未来竞争对手的工程师想要设计一颗对标英伟达最新产品的芯片。他使用的EDA工具在英伟达GPU上运行最快。那么他要么接受更长的设计周期,要么购买英伟达的显卡来设计旨在与之竞争的产品。
商业的规则正在发生深刻变化。
这里需要提供一组反映现实的数据。
在英伟达2025财年净利润表现突出的同一年,几家主要的国产GPU企业正寻求公开上市。
相关招股书显示,部分企业近年来处于持续亏损状态,累计亏损数额较大,管理层预计实现盈利尚需时间。研发投入强度很高,研发费用占营收比例显著,这超出了常规企业的经营范畴,更多依赖于资本市场融资支持发展,争取在有限的时间窗口内完成技术迭代和产品流片。
工具层面的制约更为关键。目前国产EDA工具对先进工艺制程的全流程支持尚存不足。行业人士坦言,国产EDA可以支持到一定工艺水平,但在更先进的节点上与实际应用的深度融合,还需要全产业链协同努力。
这意味着,设计先进制程芯片所需的全流程EDA工具,目前仍主要依靠国际供应商。而用于设计芯片的这些工具,正在与英伟达的生态进行深度整合。英伟达与新思科技的紧密合作,以及“独家基于英伟达架构”的标签,使得追赶本身面临一个悖论:越努力追赶,可能越需要依赖其加速生态;越想绕开,却发现可替代的路径有限。
资本市场的估值与企业的实际经营阶段之间存在反差。一些尚未盈利、依赖外部工具链的公司获得了较高的市场估值,被部分市场声音视为潜在替代者。而它们规划中的产品,其设计工具本身正逐步融入英伟达的生态体系。
回到GTC大会的那场对话。
戴利整场表现相当谦逊。“AI还远远不能自己设计芯片”这个说法,英伟达已经强调了多年。但每年的表述都有微妙演进。从“辅助设计”到“自动化某些环节”,再到如今的“极大提升特定任务效率”。每年推进一小步,同时将新的目标设定在更远处。
英伟达近期的行动,本质上是将AI深度应用于芯片产业链中价值高、壁垒深的环节,然后将这些优化后的工具和服务,提供给整个行业。
在芯片设计前端,有内部大语言模型辅助设计意图转化;在设计后端,有强化学习工具优化物理布局;整个EDA工具链,通过战略投资与合作,与自家GPU硬件深度耦合;在制造端的光刻计算领域,也有相应的加速库得到应用,提升了效率。
从设计到制造,多个环节都在被AI技术重塑。而许多环节的最优性能表现,都与英伟达的硬件平台相关联。这形成了一种深层次的生态依赖。
对于所有志在挑战行业领先地位的竞争者而言,一个复杂的局面正在形成:设计先进芯片所需的EDA工具,性能最强的版本运行在英伟达的GPU上;制造环节的某些关键计算,高效的算法库由英伟达提供;训练设计AI本身,也需要强大的算力,而这往往也来自英伟达的硬件。
竞争的逻辑正在被重新定义。
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述