GPU租赁价格继续上涨,市场在交易更长的短缺

chengsenw 网络营销评论2阅读模式

GPU租赁价格继续上涨,市场在交易更长的短缺

📊 404K · 全球科技与资本市场一手信息

404K 是一个聚焦全球科技、AI、半导体、云计算与资本市场的一手信息整理星球。这里每天更新投行研报、首页摘要、闭门会要点、宏观图表、深度订阅编译、视频文字版和音视频转录内容,覆盖 A 股、港股、美股以及海外前沿科技动态。

GPU租赁价格继续上涨,市场在交易更长的短缺

扫码加入知识星球,获取完整原文

GPU租赁不是回落,而是在交易更长的短缺

盘后我把SemiAnalysis 4月2日那篇《伟大的GPU短缺——租赁产能——推出我们的H100一年期租赁价格指数》刷完,结论其实很直接:今天真正该交易的,不是“新卡替代旧卡”,而是“真实需求把GPU短缺又往后推了一段”。

GPU租赁价格继续上涨,市场在交易更长的短缺

再说得更交易一点,就是四个字:短缺延长

(我:翻译成人话就是,新卡没把旧卡打下去,反而是新卡也缺,旧卡还在涨。)

下面这篇,我只基于今天这一份素材来写,不额外掺别的口径。

1,拐点不是芯片发布会,而是需求结构变了

事实:
这份研报把“Claude Code是拐点”写得很重。素材里提到,Anthropic的年化经常性收入在一个季度里几乎翻了三倍,从去年年底的90亿美元增长到如今超过250亿美元。同时,开源模型一侧,GLM、Kimi K2.5等用例在增加;需求端还叠加了多智能体工作负载、原生媒体生成,报告点名了Seedance和Nano Banana。研报的原话很明确:这些变化让token消耗和计算消耗呈抛物线式增长

因果:
这意味着,GPU需求已经不只是“训练一波大模型”那么简单,而是在往更多、更碎、但更高频的生产场景里扩散。尤其是多智能体工作流,特点不是一次性跑完,而是多步骤、高并发、持续迭代。只要这些工作流的投资回报率还高,需求对价格就不会太敏感。

素材里还有一个很有意思的细节:研报说,大型专家混合模型推理在像GB300 NVL72这样的新系统上效果更好,但训练任务在H100上可能仍然具备最佳性价比。这句话很关键,因为它直接解释了为什么“新卡上量”不必然等于“旧卡掉价”。

交易含义:
这就把市场逻辑从“代际替换”改成了“分工并存”。新的推理需求推高新平台,训练和部分性价比需求又把H100留住。于是结果不是此消彼长,而是两头都紧。

收束:
一句话,市场不是在交易单一产品,而是在交易需求曲线整体右移

2,供给问题也不是只有GPU,整台AI服务器都在变贵

事实:
研报反复强调,这一轮不是单纯的GPU稀缺,而是从DRAM、NAND,到光纤电缆、数据中心托管、燃气轮机,整条链条都在变紧。更硬的数字是:LPDDR5和DDR5的合同价格在2026年第一季度分别同比上涨约4倍和6倍。同时,原始设备制造商已经开始按照显著超过组件成本基础涨幅的水平重新给AI服务器定价。

因果:
这件事的杀伤力,不在“贵”本身,而在于它压缩了新部署项目的预期回报。研报给出的结论是:更高的服务器购置成本,迫使部分运营商放缓或放弃部署,原本会在这一阶段上线的供给被扣住了,反过来又继续收紧租赁市场。

换句话说,大家原来以为新供给会来救场,结果发现新供给自己也被成本卡住了。

p.s.:文中还给了几条二手信息/未证实口径,比如新的Blackwell部署交付时间被拉长到6月到7月,以及直到2026年8月到9月上线的很多产能大多已经被预订。我把这些当成情绪和景气度的旁证,但不会把它们当成无条件成立的硬事实。

交易含义:
只要瓶颈是“系统级”的,而不是“单芯片级”的,那么市场就很难简单按“新卡量产—旧卡回落”这条线来定价。供应出来得慢,价格就更难自己掉下来。

收束:
这轮交易的核心,不只是缺卡,而是缺能落地的整机供给

3,最该盯的不是按需挂牌价,而是一年期合同价

事实:
这份研报最重要的数据,是它公开了H100一年期租赁价格指数。按照素材给出的口径,H100一年期GPU租赁合同价格已经从2025年10月低点的1.70美元/小时/GPU,涨到2026年3月的2.35美元/小时/GPU,涨幅接近40%。图表和表格还给了一个区间:当前H100一年期价格大致在2.00-2.70美元/小时/GPU之间,中位数就是前面的2.35美元。

研报还写到:租赁价格在1月下旬突破2美元/小时/GPU,随后在2月下旬较1月底再涨15%-20%;报告当时的判断是,3月底还会再环比涨15%-20%。这里我得强调一下,后面这句属于研报判断,不是已经发生的既成事实。

同时,素材里给了更直白的产业反馈:到了3月,越来越难找到任何期限的H100、H200或B200租赁产能;按需GPU租赁产能也几乎卖光,锁定了按需实例的客户不愿把产能释放回资源池。

因果:
为什么这条线重要?因为研报专门解释了,GPU租赁市场的大多数大额交易,并不是按需和现货,而是至少6个月甚至更长期限的合同。大型Neocloud往往更偏好1年起步,更喜欢2年到3年,如果能做到5年更好。

也就是说,公开挂牌价能看,但很多时候滞后;按需价格也能看,但它经常是“价格先固定,利用率后波动,再隔一段时间才调整”。真正更敏感地反映供需收紧的,是中期合同,尤其是一年期。

交易含义:
如果还拿按需挂牌价去判断整个GPU景气,很容易看错方向。真正该盯的,是一年期合同价有没有继续抬台阶,以及它的分位区间有没有继续往上挪。

收束:
这不是一个“看报价单”的市场,而是一个看合同成交和期限结构的市场。

4,GPU租赁市场已经从买方市场,翻到了卖方市场

事实:
研报把市场结构拆成了三段:
短期租赁,是按需、现货和少于3个月的合同;
中期合同,是3个月到3年以上
长期承购,是4年到5年,其中5年最受欢迎。

它还给了一个很明确的变化:在2025年末之前,GPU租赁定价更有竞争性,因为运营商手里库存更多,终端需求虽然在加速,但还没完全把市场掏空。那时候大家更关心的是利用率,别让已有GPU闲着。

但现在,策略已经来了个180度转弯。Neocloud和超大规模云服务提供商开始拿到更强的谈判权:更高的预付款、更好的价格、更长的合同期限,甚至连合同起止时间都能和自己的库存节奏去匹配。素材里还提到,AI原生公司和较小的AI实验室越来越愿意签更长的合同,甚至接受高于20%的预付款;而4-5年大单涉及的集群规模,已经是50MW或100MW起跳,对应大约24,000到48,000个GB300 NVL72 GPU

因果:
这说明市场已经不是“谁有卡谁就租掉一点”的阶段,而是“谁有卡、谁能融资、谁就能筛客户”的阶段。更长的合同不仅锁收入,也能锁融资安排,研报甚至提到,这类长单在很多情况下可以锁定十几%的项目内部收益率

交易含义:
这对市场的意义很现实:现在的利润弹性,不只来自单价上涨,还来自合同变长、现金流变稳、资产寿命变长。研报后面那句我很认同——更高的租赁费率,延长了现有GPU的经济使用寿命,已投资本能在再投资前多吐更久的现金流。

收束:
价格上涨只是表面,真正的变化是定价权回到了供给侧

5,最拧巴的一幕:产业在涨价,二级市场却在怀疑它

事实:
素材里专门点出一个反差:尽管供给趋紧、价格上行的证据越来越多,但公开市场对CoreWeave、Nebius、IREN这些公司的情绪却越来越负面,股价处在6-12个月交易区间的低端

因果:
研报给的解释是,市场仍然盯着“最终供给过剩”和“商品化”的叙事,对GPU残值的担忧并没有因为这轮景气改善而明显缓解。

我自己的理解是,这不是谁对谁错,而是时间维度不一样。产业端在交易“今天不够用”;二级市场在交易“明天会不会过剩”。

交易含义:
这恰恰构成了这篇研报最大的预期差来源。只不过,这份材料没有提供公开股票的估值锚、目标价或者完整财务敏感性表,所以它给我们的更多是产业定价逻辑,而不是证券定价结论。

收束:
产业和股价现在没走在一条线上,这本身就是今天最值得盯的裂口。

研报拆解:它到底在押什么

这份研报最核心的一个判断,其实就一句话:GPU租赁价格更可能继续上涨,而不是下跌。

它押的两个关键假设,我看是这两个。

第一,需求侧的高回报还没有被高价格压住。
素材里明确写了,如果使用AI工具的投资回报率还是5-10倍,那么GPU租赁价格在涨到足以抑制需求之前,可能还有很长的路要走。这个假设背后的证据,是Claude Code、多智能体工作流、开源模型、原生媒体生成共同推高了token消耗。

第二,供给侧新增没那么快,甚至还会被系统成本反向压制。
这里的证据,是H100一年期价格从1.70涨到2.35,是LPDDR5、DDR5合同价在2026年一季度同比约4倍、6倍,也是原始设备制造商重定价AI服务器后,部分部署被放缓和取消。

至于估值锚,这份研报的特点也很鲜明:它没有提供股票估值锚、目标价,也没有把关键假设拆成完整估值模型。
但它给了一个非常清楚的定价逻辑:
租价上行 → 部署资本回报率改善 → 现有GPU经济寿命延长 → 新云服务商和持有现有GPU资产的供给方受益。

翻译成交易语言,就是两件事:
一是利润弹性
二是资产久期延长

我怎么看?

我同意它对“需求结构变化”和“1年期合同价更有代表性”的判断。这个逻辑是顺的。
我也认可它指出的那条主线:现在的问题不是一张卡,而是一整套AI基础设施供给跟不上。

但我对“价格只朝一个方向走”保留一点谨慎。
如果2026年内GB300新增供给释放速度明显快于token需求增长,那么1-3年合同市场的紧张度会先松。
否则,如果AI实验室的收入增长、采用扩散和token消耗继续比新供给更快,那么这条涨价线就还没走完。

《一张表:关键假设 / 关键数据 / 结论 / 风险》

项目
素材里的内容
关键假设
① Claude Code、多智能体、开源模型推动token消耗抛物线增长;② 高租价尚未有效压制需求;③ 服务器与内存等系统成本上行,抑制新增供给上线
关键数据
H100一年期合同价:1.70 → 2.35美元/小时/GPU(2025年10月到2026年3月),涨近40%;当前一年期区间约2.00-2.70美元/小时/GPU;1月下旬突破2美元;2月下旬较1月底再涨15%-20%;LPDDR5、DDR5合同价在2026年一季度同比约4倍、6倍
结论
GPU租赁价格更可能继续上涨,而不是下跌
风险
2026年内GB300新增节奏;台积电N3、HBM、DRAM、NAND的紧张程度;AI实验室ARR、采用率和token消耗增速

关键争论

争论点1:Blackwell上来,H100/H200是不是就该跌价了?

多头怎么说:
研报给出的答案很直接:没有。它的证据是H100一年期租赁价格已经从1.70涨到2.35,而且不少训练工作负载在H100上仍然有最佳性价比;市场上甚至出现了续签到2028年、为期4年的H100合同案例。再加上“越来越难找到任何期限的H100、H200或B200产能”,这说明旧平台没有被新平台挤出。

空头怎么说:
2025年末之前,主流预期恰恰相反:随着Blackwell部署增加,Hopper,也就是H100和H200,租赁价格理应明显下行,因为前者计算成本更低。并且,研报自己也承认,GB300集群将在整个2026年逐步增加,这本来就是缓解供给的来源。

我现在怎么处理:
我暂时站在“短缺延长”这一边,但不把它绝对化。我要看的验证条件有三个:
第一,后续月度H100一年期指数是不是还在上;
第二,GB300新增供给释放后,AI实验室是不是还在继续抢4年以下合同;
第三,1-3年合同的紧张度,是缓解还是继续抬升。
如果新增供给开始明显快过需求,这个观点就要收回来。

争论点2:判断市场,应该看按需挂牌,还是看1年期合同?

多头怎么说:
研报明确站队一年期合同。理由也很简单:大多数真实交易都发生在6个月以上,大型Neocloud往往从1年起租,更偏好2-3年,理想状态是5年。公开挂牌价和按需价格会滞后,而且很多时候只是展示,不代表真实成交。

空头怎么说:
短期按需市场也不是没价值。它是租赁期限结构的最前端,很多剩余产能和现货就在那里,利用率变化也最快。研报自己都说了,在按需市场里,利用率是需求的最佳高频指标,而不是价格

我现在怎么处理:
我的做法很明确:
主指标看1年期合同价
辅助指标看按需利用率
如果未来出现“按需利用率先掉、1年期合同价也不再上行”,那说明热度开始从前端向中端传导降温。反过来,如果按需还是紧、一年期还在涨,那就别急着讲过剩。

我的临时结论

结论先行:
今天这份材料最值得记住的一句话是:GPU租赁市场现在交易的不是降价逻辑,而是短缺被延长的逻辑。

①我更确信的:
第一,真正有代表性的价格信号,不是按需挂牌,而是1年期合同价
第二,这轮需求不是单点爆发,而是从Claude Code、多智能体、开源模型到原生媒体生成的多源扩散
第三,供给瓶颈不是只有GPU,而是AI服务器和上游部件一起收紧,所以“新卡放量=旧卡跌价”这条线太简单了。

②我还没想清楚的:
第一,高价格到底会在什么位置开始真正压制需求,素材里没有给出明确阈值。
第二,产业端的强现实,什么时候能传导到公开市场定价,现在也没有统一答案。CoreWeave、Nebius、IREN的例子,说明这个裂口还在。

③接下来最该盯的变量/数据/事件:
第一,SemiAnalysis后续的月度H100一年期指数更新
第二,2026年内GB300集群新增节奏,以及它对1-3年合同市场的挤压还是缓解。
第三,台积电N3、HBM、DRAM、NAND的紧张程度,还有AI实验室的ARR、采用率、token消耗是否继续加速。

④失效条件:
如果后续看到新增供给释放明显快于token需求增长,并且AI实验室减少对4年以下合同市场的参与,我会承认“短缺延长”这条线看重了。
如果看到H100一年期合同价停止上行甚至回落,同时短期利用率也走弱,那我也会承认这轮景气拐点已经出现。

信息整理和个人观点,仅供交流,不构成投资建议。

今天我最想说的,就这些。

(全文完)
评论区聊,明天我继续跟。

GPU租赁价格继续上涨,市场在交易更长的短缺

 
chengsenw
  • 本文由 chengsenw 发表于 2026年4月3日 00:22:42
  • 转载请务必保留本文链接:https://www.gewo168.com/34779.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: