GPU市场现在跟五一档酒店一个德性,Trainium终于不亏钱了 – 第三篇

美股Q1财报深度复盘 · 3/8

五一档酒店、存储二阶冲击与一场决定未来的ASIC暗战

第三篇 · GPU、存储、ASIC的供给侧深度

本文是”硅谷Q1财报深度复盘”系列第3篇(全8篇)。前两篇拆解了CAPEX军备竞赛与议价权重新分配,本篇是供给侧最微观的深度——GPU合约价格、存储长约谈判、自研芯片暗战。这一篇内容偏重,但每一节都是理解未来3-5年产业格局不可跳过的环节。

讲完需求侧的”三波CAPEX上调浪潮”,我们要回到供给侧的细节。需求只是故事的一面,产能侧的瓶颈和议价权变化,才是CAPEX真正”涨价”的供给侧逻辑。这一篇我们深入到三个细节:GPU合约价格的反转、存储长约的一次性冲击、四家公司的ASIC暗战。

五、GPU合约价格的”温度计”:长约挤压短约

访谈里提到了一个非常微观但极具产业意义的现象——GPU合约价格在2024年12月开始出现历史性反转。这个反转的核心特征是:长期合约、短期合约、现货价格三者同时上涨。在过去的GPU市场上,这是没有发生过的事情。

要理解这个反转的奇异之处,先来看正常的GPU价格机制。在历史上的多数时间段,GPU市场是这样运作的:

图6 · GPU合约市场:正常状态 vs 当前状态的对比

正常状态下,长约价格低于短约,短约低于现货——这是健康的市场结构,因为长期合约让出了流动性,所以应该享受价格优惠。

但当前的GPU市场,呈现的是“全线上涨”——长约价格在涨、短约价格在涨、现货价格也在涨。同时,长约的”占比”也在升:从历史的60%上升到85%以上。

访谈里给的类比非常形象:

“这就像五一假期前的酒店行业——五一前一周,所有的高端酒店都被旅行社用’长约’锁定;到五一当天,你想订一个酒店房间,会发现要么没有,要么价格涨了三倍。这是因为长约把短约和现货的供给挤压掉了。GPU市场现在是同样的逻辑。”

这种”长约挤短约”的格局,有几个深远的影响:

第一,小型企业和初创公司被推向更贵的市场。有钱有规模的大公司可以签3-5年长约,锁定相对便宜的价格;但中小公司只能在短约和现货市场上抢——也就是”五一档”市场。这会让AI算力的获取门槛变得更高,加剧”大公司垄断算力”的趋势。

第二,定价权进一步向英伟达集中。当长约比例从60%走到85%,意味着英伟达可以锁定未来3-5年85%的产能——它的产能利用率被提前确定,没有”产能空置”的风险。这是英伟达毛利率能维持在70%+的根本原因。

第三,云厂商的CAPEX节奏被英伟达”绑定”。访谈里提到的另一个细节是,GPU的leading time(交付周期)在拉长——从过去的6个月,延长到现在的12-15个月。也就是说,云厂商今天下的订单,要等一年多才能交付;而它们必须在订单发出之前就预付定金、锁定产能。这意味着云厂商的CAPEX节奏不再是”按需扩张”,而是”被供应链节奏推着走”。

⌬ 我的补充:GPU市场和半导体行业的历史规律

长约比例从60%走到85%以上,是不是不可逆?我个人的判断是它在2026-2027年大概率不会逆转,但2028年之后可能会出现裂痕。

理由有两个。第一,半导体行业历史上的”长约挤短约”格局,通常会维持2-3年。1995-1996年的内存市场、2017-2018年的存储市场,都出现过类似格局。维持2-3年之后,要么是供给端补上(产能爬坡),要么是需求端见顶(需求转弱),长约比例会回归。AI市场目前是2024 Q4开始的,意味着这种状态大概率会维持到2027上半年。

第二,长约的本质是”双方对未来的共识”——客户愿意签3-5年长约,前提是它对未来3-5年的需求有信心。一旦AI需求出现一次明显的回调(比如某个季度增速突然下滑),长约预期立即会松动,长约比例会快速下降。所以长约的”刚性”看起来强,但其实非常依赖于”需求曲线没有断点”。这是所有看多者都需要持续监测的脆弱性。

除了GPU合约价格之外,访谈里还有一个相对小但非常关键的观察:存储长约谈判,在2026年Q1-Q2之间出现了一次性涨价。

六、存储长约的”一次性冲击”:被忽视的CAPEX涨价二阶推动

市场对GPU涨价已经price-in得很充分了,但存储涨价这件事在我看来是”被严重低估的二阶推动”。

访谈里提到,2026年3-4月之间,云厂商和存储厂商(三星、海力士、美光、铠侠等)进行了新一轮的长约谈判。这次谈判的特点是,不是按”年度框架”谈,而是按”3-5年长合约+一次性大宗采购”模式谈——这导致存储采购成本出现了10-15%的额外上调。

这个上调,在Q1财报季中开始显现。但它的”全部影响”还没有完全展开——预计未来3个季度的CAPEX指引中,会持续出现”存储成本上调”的累积。

图7 · 存储成本传导链:从长约谈判到CAPEX指引的连锁反应

为什么这件事重要?有三个层次。

第一层:它会让CAPEX指引继续上调,但本质上不是需求的进一步放大。未来2-3个季度的CAPEX指引里,会有相当一部分是”存储涨价的累积释放”。这部分如果被市场误解为”需求又上来了”,可能会引发新一轮的乐观预期;但实际上是供给侧的成本上涨在transmit。

第二层:它意味着内存厂商(尤其是HBM相关的)的盈利会持续受益。SK Hynix、Samsung、美光在过去6个月已经因为HBM3E、HBM4的价格上行而股价大涨;但DDR5、SSD的长约涨价,是另一个”二阶受益”——这是被相对低估的alpha。

第三层:它会强化”存储是AI产业链下一波瓶颈”的判断。过去市场关注的瓶颈是GPU、HBM、CoWoS;但下一波瓶颈很可能是高端NAND、企业级SSD、HDD等”存储类”基础设施——因为AI模型训练需要海量的I/O吞吐。

⌬ 我的补充:存储涨价的影响,容易被低估的两个原因

为什么市场对存储涨价的关注度,远不如GPU?我觉得有两个原因。

第一,存储行业的周期性历史让市场”麻木”。DRAM和NAND行业在过去20年经历过多次大涨大跌——1995-1998、2002-2004、2017-2019、2020-2022,都是涨完一波就跌一波。所以市场对存储的”涨价”持有相当大的怀疑——总觉得”涨了多久就要跌”。但这次的存储涨价,本质上是供给侧的”长合约锁定”,和过去的”需求驱动型周期”是不同的。

第二,存储成本在云厂商总CAPEX里的占比,通常被认为只有10-15%(对比GPU的50-60%),所以市场觉得它”影响不大”。但要注意,10-15%的存储成本上涨10-15%,意味着总CAPEX上修1.5-2.0个百分点——在6300亿美元的基数上,就是10-12亿美元的额外开支。这是值得监测的信号。

把GPU合约和存储合约的涨价叠加起来看,我们就能理解为什么2026年的CAPEX指引会从年初的5500亿美元,一路被上调到6300亿美元——这是”需求拉动+供给挤压”的双重叠加。但这部分还不是CAPEX故事的全貌。CAPEX的真正分配,还要看每家公司在自研芯片(ASIC)上的策略——这是接下来这一章要讲的。

七、ASIC暗战:四家自研芯片背后的”非通缩护城河”逻辑

这是访谈里最有产业纵深的一段,也是我个人觉得对未来3-5年AI产业格局影响最深远的一个判断。

四家Hyperscaler都有自己的ASIC芯片项目:

公司	ASIC名称	代际成熟度	软件生态	商业进展
Google	TPU (v6/v7)	最成熟	JAX/XLA最完整	Anthropic+Gemini双客户,90万+卡部署
Amazon	Trainium (T2/T3)	2026Q1拐点	Neuron SDK,推进中	Anthropic 5GW承诺,从亏损到盈利
Microsoft	Maya 100	小模型阶段	早期,依赖CUDA翻译	推理为主,Frontier训练未跑通
Meta	MTIA	仅内部	仅PyTorch内部	推荐系统场景,推理工作负载

访谈里把这四家的ASIC策略做了非常精妙的对比。从最成熟到最早期,排序是 TPU > Trainium > Maya > MTIA。

但有意思的是,亚马逊CEO Andy Jassy在Q1财报会上有一段非常关键的话(原文是英文,我转译过来):

“Trainium过去主要是作为’促销品’存在的——我们用低于成本的价格把它推给客户,目的是让客户在AWS上用Anthropic的模型时,不必非用GPU不可。但从这个季度开始,Trainium已经实现了正向的盈利贡献。我们预计Trainium在未来3-5年,会为亚马逊节省数百亿美元的CAPEX,并贡献数百个基点的运营利润率。”

这段话被市场严重低估了。它表达的核心信息是:Trainium从”成本中心”切换到了”利润中心”——这个切换的拐点,正好在2026年Q1。一旦发生,意味着亚马逊的云业务会出现两个变化:第一,GPU采购的边际依赖度降低;第二,云业务的整体毛利率可以上行——因为自研芯片的TCO优势,会有一部分回流到亚马逊的margin里。

要理解这个”自研芯片的经济学”,最好的参照系是亚马逊自己的Graviton历史。

图8 · Graviton经济学:30%TCO优势的”三方共赢”分配

Graviton这个产品,从2018年首发到现在,已经服役7年。它的故事是访谈里给出的最重要的产业类比。我把这个故事完整讲一遍,因为它就是接下来Trainium、TPU、Maya经济学的”母本”。

2018年,亚马逊推出第一代Graviton,基于ARM架构。当时业内的反应是”这玩意没人用”——因为ARM架构和x86有兼容性问题,客户从英特尔/AMD的x86实例迁移到Graviton,需要重新编译、重新测试。

2019-2020年,亚马逊用了一个”非通缩商业模型”的策略:推出Graviton2,主打”比英特尔/AMD的同等性能实例,客户的TCO低20%”。注意,客户便宜的是20%,但Graviton2本身的实际成本,比英特尔/AMD便宜30%。也就是说,Graviton的30% TCO优势里,亚马逊把20个百分点返还给客户,自己留下10个百分点拉升毛利。

2021-2024年,Graviton3、Graviton4陆续推出,占AWS新增计算实例的比例,从2019年的不到5%,上升到2024年的50%以上——意味着每两台新增的服务器里,就有一台跑Graviton。这个”非通缩商业模型”的成功,让亚马逊的云业务在2022-2024年的毛利率持续上行。

访谈里特别强调:这不是为了打败英特尔/AMD,而是在”云的通缩商业模型”里,建立一个”非通缩”的护城河。

⌬ 我的补充:云行业的”通缩 vs 非通缩”逻辑

什么叫”云的通缩商业模型”?这个框架理解起来需要一点时间,但非常关键。

云行业的本质是”标准化基础设施”——你卖一个虚拟服务器,我也卖一个虚拟服务器,客户最终选谁很大程度看价格。所以行业天然有价格通缩的压力——AWS、Azure、GCP之间,过去十年的服务器单价一直在每年-5%到-10%的速度下降。这就是”云的通缩商业模型”。

在这个商业模型里,如果你不做点什么,你的毛利率只会越来越薄。所以云厂商一定要做”非通缩”的产品——也就是无法被简单价格比较的差异化产品。Graviton就是典型,因为它只在AWS上——客户不能从Azure或GCP买到一样的Graviton实例,所以它的价格不进入”标准化通缩比较”。

这就是为什么访谈里说,自研芯片不是”用来打败英伟达”的——而是用来在”云通缩压力”下建立一个不被通缩侵蚀的利润池。这个判断对TPU、Trainium都成立——它们的目的不是把英伟达赶出市场,而是在云业务里建立一个非通缩的利润源。

这个逻辑要套在Trainium上,关键在于:Trainium的”30% TCO优势”什么时候能稳定形成?

访谈里给出的判断是,2026 Q1是Trainium的”商业拐点”——之前它是促销品,现在开始它是利润源。具体表现在三个数据上:第一,Trainium的可披露增长率达到40%(亚马逊在财报会上提到的”high triple-digit growth”);第二,Anthropic承诺消耗5GW的Trainium算力;第三,亚马逊在新建的几个数据中心里,Trainium实例的部署比例已经超过30%。

但相比TPU,Trainium还有距离。TPU的关键优势是软件生态最完整——XLA和JAX经过Google内部多年打磨,已经能让TPU和GPU在Frontier Lab级别训练上跑出可比的TCO。Anthropic在Trainium和TPU上都有大规模部署,这背后的对比也很微妙——Anthropic的最新一代模型,大部分依然在TPU上训练,Trainium主要承担推理负载。

Maya和MTIA则更早期。Maya目前主要服务微软自身的小模型推理(Copilot、Azure AI Search等);MTIA主要服务Meta的推荐系统训练和推理(Avocado、Latte模型)。两者距离Frontier Lab级别的训练还有相当大的距离。

所以四家ASIC的成熟度,目前的格局大致是:

TPU(谷歌):成熟,2-3个Frontier Lab在用,商业化最深入,TCO最有优势。
Trainium(亚马逊):今年Q1见到拐点,Anthropic是关键客户,2027年大概率全面盈利。
Maya(微软):小模型阶段,主要服务自家产品,距离Frontier Lab级别训练还有3-5年。
MTIA(Meta):仅服务内部,主要在推荐系统和推理。

这个排序,基本就是我们后面几章会看到的”四家公司在AI变革中的相对位置”。

📖 下一篇预告

第4篇 · AI收入”罗生门”、三条变现路径、RPO的领先指标——同样讲”AI收入”,微软的口径和亚马逊的口径差着十倍。三条变现路径(云、应用、广告)的天花板和竞争格局完全不同。RPO这个被严重低估的指标,藏着云增长的真实信号。

系列全集导航

第1篇 · 6300亿压顶:开篇与7月分界线第2篇 · 利润分配反常识与三波CAPEX浪潮▸ 第3篇 · GPU、存储、ASIC的供给侧深度(本篇)第4篇 · AI收入罗生门与三条变现路径第5篇 · 谷歌的三重护城河 vs 微软的隐忧第6篇 · 亚马逊的逆袭剧 vs Meta的精算第7篇 · AI Coding革命与OPEX TAM第8篇 · 收敛模型、体检报告与六大判断

— 第3篇完 —