GPU租赁市场告急: SemiAnalysis正式发布H100一年期租赁价格指数
“ 原文来自 SemiAnalysis,作者:Daniel Nishball、Jordan Nanos、Cheang Kang Wen 等,2026年4月2日发布。以下为全文翻译。

Anthropic的Claude 4.6 Opus和Claude Code需求暴涨。Anthropic的年化经常性收入(ARR)在短短一个季度内翻了三倍多——从去年底的90亿美元飙升至如今的300亿美元以上。GLM和Kimi K2.5等开源模型的兴起也推动了开源模型使用场景的激增。与此同时,Anthropic、OpenAI以及多家Neolab的融资活动也在大量消耗GPU资源。
这个拐点意味着需求急剧攀升,超大规模云厂商和新兴云服务商(Neocloud)的GPU资源遭到疯抢。
这种新增需求推高了整条供应链上的产品和服务价格——从DRAM和NAND存储,到光纤电缆、数据中心托管以及燃气轮机,无一幸免。

GPU租赁价格是最新一个出现供给严重紧缺和价格大幅跳升的计算相关产品。 H100一年期GPU租赁合同价格从2025年10月的低点1.70美元/小时/GPU,飙升至2026年3月的2.35美元/小时/GPU,涨幅近40%。
按需(On-Demand)GPU租赁容量在所有GPU型号上全面售罄——即便最近价格持续上涨,锁定了按需实例的用户也不愿将容量释放回资源池。2026年初想找GPU算力,就像试图买末班航班的机票——价格高企,几乎无票可买。这还只是一个温和的比喻。更贴切的比喻是:想租一个集群,实际上就像在买毒品。
SemiAnalysis在GPU租赁市场的角色

在SemiAnalysis,凭借我们在ClusterMAX、InferenceX和AI云总拥有成本(TCO)模型方面的工作,我们一直深度跟踪Neocloud和超大规模云生态系统中的GPU租赁价格走势。
我们也花大量时间帮助AI实验室对接Neocloud、在市场上寻找GPU租赁机会,并与生态中几乎所有参与者积极讨论GPU租赁价格趋势。
自2023年起,我们就为客户维护了GPU租赁价格指数,跟踪几乎所有主要GPU型号(H100、H200、B200、B300、GB200、GB300、MI300、MI325、MI355)在所有关键租赁期限上的定价——从按需和1个月一直到5年期。我们的指数通过调研数据构建,覆盖多家Neocloud和算力买方,同时通过实际成交数据以及我们自身促成的交易进行验证。
今天,我们将H100一年期GPU租赁指数公开发布,为社区提供更多数据和洞察。我们每月更新指数,并将通过X和LinkedIn等社交媒体页面提供最新趋势和市场花絮的评论。完整的期限结构和其他主要GPU型号的租赁定价可供机构订阅用户通过我们的AI云TCO模型获取。
本文将讨论GPU租赁市场的最新趋势、市场花絮和数据点,解释我们如何分析更广泛的GPU租赁市场结构,并展望租赁定价的未来走向。
动态定价来到GPU租赁市场

一年期H100租赁价格的图表并不足以展现这一趋势的全貌——我们在采购算力过程中的亲身经历和市场其他参与者的反馈,描绘了一幅更加惊人的画面。
需求在众多高度差异化的使用场景中都非常强劲,不存在一刀切的方案。有大量推理工作负载(如大型混合专家(MoE)推理)在最新的大型世界级系统如GB300 NVL72上运行效果最佳,而训练工作负载在H100上反而可能拥有最佳的性价比,使得即便是老一代显卡的需求也保持高位。
客户们争相支付14美元/小时/GPU来获取AWS上的p6-b200 Spot实例;一些Neocloud巨头已不再出售单节点;H100正在以2-3年前签约时的完全相同价格续约,甚至有些H100合同被续签至2028年(即四年期合同)。想找哪怕8个节点(64个GPU)的H100或H200都非易事——我们询问的一半供应商已经完全售罄,大多数供应商的回复是根本没有任何Hopper GPU的容量可以释放。
我们甚至听说有算力租户在拆分他们的集群并转租算力——就像摩纳哥大奖赛期间的公寓转租一样。不久的将来,可能会出现"Neocloud二房东"这一新职业?

Blackwell的供应也非常紧张。我们了解到,由于开源权重模型的强劲需求以及持续攀升的推理需求,新的Blackwell部署交付时间已延长至6-7月。市场范围内,直到2026年8-9月的所有新增容量都已被预订一空!
GPU租赁价格——王者归来
市场是怎么走到这一步的?就在六个月前,大多数市场观察者还对GPU的终端价值持怀疑态度,认为GPU租赁费率将不可逆转地大幅下降。金融分析师批评任何将GPU计算资产折旧期设为6年的Neocloud或超大规模云厂商。让我们先快速回顾一下此前的发展历程。
2025年下半年之前,整个生态的普遍预期是,随着Blackwell部署的上量(鉴于后者远低的计算成本),Hopper(即H100和H200)的租赁价格将大幅下滑。然而,2025年底实际发生的却恰恰相反:H100的需求不仅稳住了,在许多情况下还在增强。开源权重模型的迅速采用和推理需求的加速增长,成为了即将涌入市场的巨大算力需求浪潮的第一个信号。
1月是算力市场的下一个拐点。 存储价格——无论是DRAM还是NAND——从连续数个季度的大幅上涨,变成了彻底的抛物线式飙升。根据我们的存储模型,LPDDR5和DDR5的合同价格在2026年一季度分别录得约4倍和约5倍的同比增长。

为了管理这种组件成本快速上涨带来的利润率风险,OEM厂商开始以远超底层组件成本涨幅的幅度重新定价AI服务器。这使集群资本投入的决策过程变得复杂——更高的服务器采购成本压缩了潜在的项目回报,迫使部分运营商放慢或放弃部署计划。实际上,本应上线的供给被扣留了,进一步收紧了租赁市场。
在这场"AI服务器定价末日"引发的服务器采购混乱中,GPU租赁需求明显在加速,1-2月间剩余的闲置容量被完全消化。到了3月,要找到任何H100、H200或B200的租赁容量,无论期限长短,都变得越来越不可能。一年期合同的租赁定价在1月底突破了2美元/小时/GPU,随后在2月中下旬较1月底再涨15-20%,预计到3月底将再环比上涨15-20%。
今年年初的一个主要需求驱动力来自原生媒体生成——Seedance和Nano Banana正在推动Token吞吐量的大规模增长,用户在大规模生成和迭代图像及视频。但最引人注目的需求驱动力是多智能体(multi-agent)工作负载的兴起——这些工作负载执行多步骤工作流、高并发运行并持续迭代,导致Token和算力消耗呈抛物线式增长。
看看我们在多篇文章中已经指出的Claude Code趋势就够了。SemiAnalysis公司本身在过去7天就消耗了数十亿Token,平均成本约5美元/百万Token,但在节省时间和扩展工作流与能力方面的回报远超这一成本。SemiAnalysis现在在工作流中部署了一整套AI工具——超越了简单的搜索和摘要——包括仪表盘搭建、自动化数据抓取、大规模数据整理和智能体化的金融建模。
我们通过"Claude每日代码提交量"等代理指标追踪这种压倒性的需求。按照目前的增长轨迹,我们相信到2026年底,Claude Code将贡献所有日常代码提交的20%以上。当你还在犹豫时,AI已经吞噬了整个软件开发行业。
我们圈子里几乎所有人都是Claude Code的重度用户——但我们也清楚,我们的社交圈深度沉浸在AI和半导体的一切事物中,他们只是冲在最前面的先锋。对于许多财富500强公司和更广大的世界来说,Claude Code和智能体世界还只是一个可能出现在他们Facebook信息流或NPR播客中的趣闻轶事。他们完全没有意识到,智能体世界即将释放出的生产力浪潮和颠覆性变革。
随着更广泛经济体中的参与者认识到AI工具惊人的投资回报率并加入这波浪潮,Token消耗量将持续阶梯式攀升。关于AI真正回报的争论现在已经尘埃落定——AI工具的使用可以带来比工具成本高出一个数量级的价值。需求曲线的上移和右移,为GPU租赁定价提供了一股强大且相对缺乏弹性(至少目前是这样)的推动力。
简单来说——如果AI工具的投资回报率是5-10倍,那么GPU租赁价格在涨到足以抑制需求之前,显然还有很长的路要走。 如果租赁定价的上涨进一步推高服务器和组件成本,我们不会感到意外。
SemiAnalysis一年期H100合同价格指数介绍
今天,我们将SemiAnalysis H100一年期租赁合同价格指数免费公开,以提升GPU租赁市场趋势的透明度和认知度。
我们的指数基于每月覆盖100多个市场参与者(包括Neocloud供应商、算力买方和卖方)的直接调研数据构建,确定GPU租赁合同的代表性价格区间(第25至第75百分位)。我们通过成交数据以及我们自身促成的交易来验证这些价格水平——在我们的网络中对接算力买卖双方。
自2023年起,我们跟踪了H100、H200、B200、B300、GB200、GB300的3个月至5年各期限的合同市场价格,并有AMD系列(MI300、MI325、MI355)的部分数据。
SemiAnalysis H100一年期合同价格指数相对于现有GPU指数的独特价值在于以下几点:
第一,聚焦合同市场。 许多GPU租赁指数基于Spot/按需挂牌价或公示价格,但GPU租赁市场的大部分交易以长期合同形式完成,至少6个月甚至更长。这些价格通过双边谈判确定,报价和成交价格通常不会公布到任何免费公开的在线数据库中。大多数大型Neocloud更倾向于以至少1年期出租容量,2-3年期更佳——如果能签下5年期大额承购协议就更理想了。SemiAnalysis H100一年期租赁合同价格指数专注于大部分租赁量成交的合同市场,且参照特定期限,使用户更容易理解其所对应的市场细分。
第二,反映真实成交价。 无法保证算力买方的实际成交价格与超大规模云厂商和Neocloud公示的价格一致。这些公示价格可能调整,能提供GPU租赁价格走势的方向性信号,但无法准确反映实际成交价格。通常,这些公示价格在合同市场价格已经变动之后才会调整,滞后于实际的算力需求趋势。特别是按需市场以固定价格运作,利用率或使用率才是变量,价格仅在必要时临时调整。
第三,质性与量化并重。 有不少指数擅长消化大量报价、价格和交易数据,也是分析市场趋势的优秀工具。我们的方法本质上涉及与市场参与者及其背后决策者的直接互动。每一个报价和每一笔交易背后都有一个故事,我们旨在传递有助于全面理解GPU租赁市场的质性和量化趋势及花絮。
机构订阅用户可以访问几乎所有当前活跃GPU租赁市场的完整期限结构。
与此同时,我们也为机构Tokenomics模型订阅用户推出了SemiAnalysis Tokenomics仪表盘——一个用于跟踪和理解前沿AI模型格局的工具。用户可以在编程、推理、数学和智能体评估维度上构建自定义基准对比,比较各主要模型和供应商的API定价,并查看主要AI实验室的关键披露数据,包括Token量、收入、估值和客户数。
GPU租赁市场结构
2025年下半年之前,GPU租赁定价竞争更加激烈——运营商拥有更大的GPU库存,而终端需求才刚刚开始实质性加速。定价是竞争性的,多家Neocloud能够提供非常有竞争力的报价。这些运营商优先考虑利用率,确保在下一代GPU更新周期可能给在役GPU服务器定价带来压力之前,充分利用固定的算力资产。
此后,GPU租赁供应商的策略发生了180度大转弯。Neocloud和超大规模云厂商现在掌握了主动权——他们可以谈判更有利的条款,如更高的预付款、更好的价格、更长的合同期限,甚至可以挑选合同的开始和结束日期以匹配其库存可用性。时间也站在了Neocloud一边——他们可以按照自己的节奏规划部署,利用不断上涨的价格环境,为特定集群逐步打造最优的客户组合。
GPU租赁市场结构最好按三个主要细分市场来理解,每个细分市场倾向于服务不同类型的客户:
1. 短期租赁:按需、Spot及3个月以下合同
短期租赁代表租赁期限结构的最前端,在许多情况下是剩余容量,不过RunPod和Lambda等企业非常成功地专注于提供大量灵活的按需或Spot容量。按需定价的运作方式与合同GPU租赁市场截然不同。供应商通常设定一个固定的按需价格,只会非常偶尔地调整价格。
供应商会根据利用率水平临时调整价格——如果利用率太低,他们会降价吸引需求。如果利用率已经满载——则会涨价,因为供应商判断即便在更高价格水平下利用率仍将保持高位。这就是为什么Neocloud公示的按需价格时间序列会长时间保持平稳,然后突然跳涨或跳跌。在按需市场中,利用率才是最佳的高频需求指标,而非价格。
2. 中期合同
更具经济意义的细分市场是合同市场,大部分GPU租赁按价值计算在此成交。1年期细分捕获了非AI实验室客户的边际需求以及大型买方的溢出需求,使其成为对紧缩状况最敏感的指标。AI原生公司和中小型AI实验室主要出现在1-3年期合同中,不过越来越多的这类实验室和AI原生公司正在寻求通过签订4年以上的长期合同来锁定算力,甚至同意超过20%的高预付比例——这在以前的4年期以上交易中是非典型的。
3. 长期承购协议
4-5年期合同这一细分市场由AI实验室主导,它们提前锁定巨量容量。这些交易涉及50MW或100MW甚至更大的大型集群——相当于约24,000至48,000个GB300 NVL72 GPU。整体而言,这些交易占Neocloud GPU租赁市场总量的很大比例。
AI实验室青睐这类合同,因为可以一次性锁定大量算力以满足快速加速的终端需求。AI实验室在集群设计方面也有相当大的话语权,可以做出关于存储、网络、CPU算力等方面的决策。这些通常是裸金属(bare metal)交易,因为AI实验室拥有工程专业知识来定制技术栈的更多层级,提取最高的每TCO性能。
Neocloud青睐这类交易,因为可以将销售资源集中在少数几笔大型承购交易上,而非数十笔最终产生相同收入的小额交易。长期合同也有利于Neocloud安排与合同期限匹配的债务融资——以优惠条件消除大部分久期风险和GPU租赁价格风险,在大多数情况下锁定十几个百分点的项目IRR。超大规模云厂商也常常为这些交易提供担保——作为Neocloud的直接承购方,然后再将算力转售给AI实验室。这种结构对各方都有利:Neocloud可以以非常优惠的条件融资,因为其承购方是AAA评级的超大规模云厂商;而超大规模云厂商则可以通过提供其资产负债表的担保来获取项目收入的一部分,同时实际上不扩张资产负债表。
在当前的市场环境下,大多数正在上量的大型AI集群都是AI实验室的专属资源,不过这些实验室仍在进入4年以下的合同市场以补充现有的容量扩张。它们也通过直接续约现有的H100和H200集群,间接阻止了供给回流至4年以下的合同市场。随着AI实验室扩建其GB200和GB300超级集群,1-3年期合同市场的供需动态将如何演变值得关注。
未来展望
最引人注目的是这些底层动态与市场情绪之间的脱节。尽管有明确的供给紧缩和价格上涨的证据——这些条件本应直接通过利润率扩张和更长使用寿命的论据使Neocloud受益——但公开市场情绪却日益转向看空CoreWeave、Nebius、IREN等公司,这些公司的股价目前处于6-12个月交易区间的低端。
市场仍然锚定在最终将出现供过于求和商品化的叙事上,上述发展未能缓解市场对GPU终端价值的担忧。然而,实地情况指向所有Neocloud供应商持续的稀缺性和定价权——表明在如此严重的短缺下,所有算力都将有需求,无论相对性能如何。
展望未来,需要关注三个检查点来判断GPU租赁价格是否会继续维持高位:
一、GB300集群将在2026年全年上量。 我们将监测新增算力容量和Token量是否能缓解持续的算力紧缺,还是Token需求会超过这些新增量。这将决定AI实验室在4年以下市场的参与程度,以及该细分市场的定价趋势走向。
二、硅片短缺是否会进一步恶化。 我们最近撰写了关于AI硅片大短缺的文章,指出台积电N3逻辑晶圆产能以及HBM、DRAM和NAND存储等方面的紧张状况。由于这些复杂制造工艺中随时可能出现执行问题,情况可能进一步恶化。
三、AI实验室的ARR如何持续增长。 以及采用率扩散和Token消耗持续增长的速度。我们的AI Tokenomics模型专注于此,分析关键的需求和使用信号以跟踪终端需求。
价格只会朝一个方向走,ROIC紧随其后
综合以上因素,可以得出一个明确的结论:GPU租赁定价继续上涨的可能性大于下跌。
这种动态是自我强化的。随着Neocloud看到供给紧缩和价格上涨,它们会抢先采购更多硬件以应对进一步的价格上涨,这只会进一步紧缩供给并推高价格。这与2023-2024年的GPU短缺如出一辙——当时紧缩的供给使OEM厂商推动了超额的利润率扩张,并引发了服务器价格的大幅飙升,不过我们认为这次服务器市场已经足够成熟,可能不会重演那一幕。
正如我们近期在机构客户报告中论证的那样,GPU租赁定价的再加速通过扩大已部署资本的利润率来改善Neocloud的ROIC。同时,更高的租赁费率延长了现有GPU的经济使用寿命,意味着投入资本在需要再投资之前能够产生更长时间的现金流。
目前,最明确的受益者是那些具备以下特征的供应商:
-
较短合同期限(更快重新定价) -
大规模H100装机基础 -
近期新增容量
拥有较短合同期限的Neocloud将看到容量到期并以当前市场环境重新定价,实现即时的利润率扩张。同时,锁定下一代多年期容量的超大规模云厂商和Neocloud也将受益。
如果我们说这次也许真的不一样——会不会太乐观了?
本文由 SemiAnalysis 原创发布,翻译仅供参考学习。原文链接:SemiAnalysis


评论