英伟达的万亿市场会到来吗?

点击蓝字 关注我们 一起摆摊

英伟达不仅要垄断GPU,更要吃透全栈计算生态

▲ 现场图:黄仁勋在 GTC 2026 大会演讲
北京时间2026年3月17日凌晨,英伟达年度开发者大会(GTC 2026)在加州圣何塞SAP中心正式开幕。CEO黄仁勋身着标志性皮夹克,进行了长达两个半小时的主题演讲,密度之高、信息量之大堪称"地毯式轰炸"。
核心发布一览:


1. 从“算力工厂”到“Token工厂”:计算范式的彻底颠覆
过去几年,我们习惯了把数据中心称为“算力工厂”,核心是堆砌FLOPs来训练庞大的模型。但Vera Rubin平台的诞生,标志着行业的重心已经彻底倒向了推理(Inference)。
Rubin并非单一芯片,而是英伟达精心设计的六芯协同平台。Vera Rubin超级芯片将一颗Vera CPU与两颗Rubin GPU封装于同一处理器,其余四颗芯片——NVLink 6交换机、ConnectX-9超级网卡、BlueField-4数据处理器和Spectrum-6以太网交换机——共同构成完整的AI工厂基础设施。
来看一组堪称变态的数据:
台积电3nm制程,塞进了惊人的3360亿个晶体管。
288GB HBM4e内存,解决了大模型推理中最致命的“内存墙”问题。
单Token生成成本直接降到了Blackwell的十分之一。
英伟达声称,Vera Rubin平台在推断token成本上较Blackwell降低10倍,训练混合专家(MoE)模型所需GPU数量减少75%。黄仁勋将其定义为“算力工厂革命”:与Grace Blackwell相比,Vera Rubin每瓦特可交付的性能提升10倍。
同时,黄仁勋宣布2027年将量产交付Rubin Ultra,Rubin Ultra的NVL576配置将在单一机架内整合576颗GPU,FP4推断算力跃升至15 ExaFLOPS,是Rubin NVL144的四倍。内存升级为HBM4e,整机内存容量达365TB。


2.“解耦推理”:把最强对手变成自己的核武器
还记得那个曾经号称要“干翻英伟达”、用超低延迟震惊业界的Groq吗?英伟达不仅收购了它,还把它彻底“武器化”了。在全新的架构中,英伟达首创了“解耦推理”(Decoupled Inference)**范式:
GPU负责预填充(Prefill):一口气吞下长文本;
LPU负责解码(Decode):极致提速逐字吐出Token。
英伟达让NVLink把擅长预填充的GPU,与擅长极速解码的LPU(内部塞满SRAM而非HBM)绑在一起。结果是破坏性的:首Token延迟被硬生生压到了0.1毫秒以下,吉瓦级数据中心的吞吐量提升了35倍。这不仅堵死了AMD等厂商主打性价比的路线,连SambaNova、Cerebras等试图以“推理专用ASIC”突围的初创公司,也被黄仁勋用资本(收购Groq)和架构创新逼到了死角。


3. NemoClaw登场:给开源Agent装上“企业级防盗门”
如果说Vera Rubin是在硬件底层筑起高墙,那么NemoClaw的发布,则是英伟达在软件应用生态上彻底收网的标志。
此前,开源AI Agent框架OpenClaw凭借极高的人气席卷开发者社区,但也暴露出多达512个安全漏洞,被各大企业IT部门列入黑名单。黄仁勋敏锐地抓住了这个痛点,顺势推出了NemoClaw企业级安全部署方案。
通过一键部署、OpenShell沙箱隔离以及隐私路由,NemoClaw给那些在企业内网“裸奔”的智能体穿上了防护服。

黄仁勋在台上喊出“每家企业都应制定OpenClaw战略”,这绝不是一句空话——当NemoClaw成为企业部署Agent的标配,英伟达就顺理成章地掌握了整个企业AI工作流的入口。
这看似是“不绑定硬件”的开放生态,实际上是在潜移默化中培养企业客户对英伟达全栈方案的路径依赖。卖芯片只是第一步,定义未来的软件标准才是最终目的。


4. 万亿美元的豪赌与“太空算力”的野望
在演讲的尾声,黄老板抛出了两个极具视觉冲击力的炸弹:
第一是万亿美元的营收预测。
第二是Space-1太空算力模块。
当马斯克的SpaceX把互联网发射到天上时,英伟达正在把AI算力送入轨道。
在太空中直接利用AI进行遥感分析、路由调度,远比把海量数据传回地面要高效得多。短期看,这更像一次品牌事件;但长线看,随着低轨卫星星座爆发(SpaceX Starlink、国内星网等),轨道上的边缘AI推理需求将真实存在——卫星图像实时处理、太空通信智能路由、轨道碎片预警等。英伟达提前卡位的嗅觉值得关注。
从覆盖海陆空的硬件算力,到NemoClaw把持的企业软件入口,GTC 2026的真正信号,不在于任何单一产品,而在于英伟达正在完成一场历史性的身份转换——从"卖GPU的芯片公司"进化为"定义AI基础设施标准的平台公司"。
但这也把真正的压力留给了行业的另一端——应用层。当底层算力的成本正在以指数级下降,当“Token工厂”的产能即将喷涌而出,科技行业亟需回答那个最致命的问题:
除了聊天机器人和代码助手,我们究竟什么时候才能创造出配得上这万亿美元基建投入的超级应用?
如果AI应用侧的商业化进度跟不上基础设施投资的速度,"Token工厂"是否会变成"Token仓库", 英伟达的万亿市场会到来吗?


评论