AI算力租赁:700亿市场超微断供谁受益
核心结论:从"炒题材"到"真赚钱",算力租赁进入业绩兑现期
2026年Q2是算力租赁行业的分水岭:散租短租转向万卡级五年长约,行业净利率从10%-15%向20%突破,AI应用落地让token消耗量呈十倍以上增长。超微事件二次发酵加速行业出清,头部三家公司将占据万卡级长单市场极高份额。
一、需求端:Token消耗量指数级爆发
关键数据:
-
传统文本推理需300 token,自动订票需5000-15000 token,4K截图/5秒视频需2000-8000 token -
2026年3月豆包日token突破120万亿,三个月环比增长一倍 -
中国模型token调用量连续五周超越美国,性价比全球领先 -
三方预估2026年国内算力租赁市场规模突破700亿元(增速翻番),2027年有望达千亿
需求爆发的底层逻辑:AI从"训练成本项"变成"推理利润中心"。消费端ARR从2025年12月的90亿美元增至300亿美元(三个月增长300%),云厂商算力直接关联营收利润,将进一步加大投入。
二、供给端:超微事件大洗牌
超微事件冲击波:
-
美国司法部扩大调查,超微暂停中国区新订单 -
B300服务器单台八卡现货价突破450万元,较25年下半年累计上涨超40% -
新订单交付周期从1个月延长至3个月以上 -
中小厂商B卡获取难度升级,估值持续承压
龙头应对策略:
-
渠道多元化:通过英伟达原厂、台系OEM、戴尔/惠普合规渠道替代超微 -
价格传导:26Q2新签长约租金较年初上涨超30%,覆盖成本上涨 -
提前锁价锁货:协创、宏景已锁定2026年B300货源
行业格局判断:超微事件加快行业出清,2026Q1参与厂商较2025Q1明显减少,份额向头部集中。未来3-6个月头部三家公司将占据万卡级长单市场极高份额。
三、商业模式升级:从裸租到Token分成
盈利模型(万卡集群为例):
-
硬件投入:1250台八卡B300服务器,初始投资近60亿 -
收入:五年期长约合同价从年初70亿大关进一步上涨,年均租金收入超14-15亿 -
成本:融资成本约2亿/年(年化4%以内)+ 折旧8-9亿/年 + 维保约1500万 -
利润:年均毛利润4-5亿,净利率10%-15% -
Token分成落地后净利率可突破20% -
三年全额现金流回本,剩余两年折旧完成后租金全部转化为净利润
最关键的变化:行业从裸算力出租向模型服务、token分成模式升级。头部公司已与国内头部模型公司洽谈合作,实现估值与EPS共振。
四、投资标的:确定性排序
|
|
|
|
|
|
|---|---|---|---|---|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
投资逻辑链:Token需求指数级增长 → 算力供不应求 → 超微断供加速出清 → 头部锁定万卡长约 → 从裸租到Token分成 → 净利率从15%向20%突破 → 估值与EPS共振。
五、中国算力出海:被低估的叙事
一个容易被忽略的视角:中国算力性价比全球领先。
-
中国模型token调用量连续五周超越美国 -
国内电力、算力成本优势显著 -
腾讯云、阿里云2026Q1已多次涨价,涨价底气来自需求暴涨而非成本推动 -
英伟达已投资CoreWeave(追加20亿美元)和Lambda Labs(20亿美元),算力租赁被全球认可为AI核心资产
六、关键时间节点
- 2026年5月:
宏景科技140亿万卡项目验收确收,收入计入半年报 - 2026年Q2-Q3:
协创数据200亿新合同交付确收 - 2026年下半年:
AIDC需求可能再次暴涨(类似2025年11-12月集中下单) - 2027年:
Token分成模式有望落地,净利率突破20%
免责声明:本文基于公开研报整理,不构成投资建议。股市有风险,投资需谨慎。数据来源:IMA专家调研纪要(2026年4月)。


评论