AI云服务市场格局重塑:从算力租赁到Token服务的盈利变革

近期 AI 云服务市场呈现明显的利润分化态势,Oracle、Coreweave 等厂商盈利不及预期,Azure 利润率持续下滑,而 AWS 在 2026 年第一季度营业利润率环比大幅提升 213 个基点,核心驱动力正是其与 Anthropic 联手打造的Token-as-a-Service(TaaS) 新模式,这也为国内算力租赁厂商转型提供了重要参考方向。
一、TaaS 模式:颠覆传统算力租赁的盈利新范式
传统云服务以 IaaS 模式为主,企业签订长期合约租用 GPU 算力,收入稳定但利润率受硬件折旧、电力及运维成本严重挤压。AWS Bedrock 平台彻底打破这一格局,客户不再租赁硬件,而是直接采购模型生成的 Token 服务,以 Anthropic 旗下 Claude 模型为核心载体,构建了全新的收益体系。

AWS 在该合作中实现三重收益:
1.基础算力费用:对标传统 EC2 实例的基础设施使用费;
2.平台分成收益:作为模型分发渠道获取的服务佣金;
3.绩效激励分成:当 Anthropic 单兆瓦算力年化收入突破阈值后,获得额外奖励。
这种模式经济效益远超传统业务,SemiAnalysis 数据显示,2026 年第一季度 Anthropic 在 Bedrock 上每兆瓦算力年收入达 2600 万美元,平台 EBIT 利润率高达 55%,远高于传统 GPU 租赁业务。同时 Bedrock 增长迅猛,一季度、四季度收入环比分别增长 170%、60%,年化收入规模达 55亿美元,占据 AWS AI 业务 37% 份额,其中 80%-90% 客户使用 Claude 模型。
对比来看,Azure 与 Google Cloud AI 业务中传统 IaaS 占比超 80%,业务结构差异直接导致利润率差距。该模式对合作双方均有益处:Anthropic 无需签订高额长期算力合约,即可借助 AWS 企业客群快速扩张;AWS 虽放弃部分长期稳定收入,却收获更高利润率与市场灵活性,Anthropic 一季度新增年化经常性收入 210 亿美元,总 ARR 达 300 亿美元,推理业务毛利率从 2024 年 – 94% 飙升至2026 年 60% 以上,进一步放大 TaaS 模式优势。
二、自研芯片:AI 云厂商的核心竞争力分水岭
AWS 的盈利突破,离不开垂直整合的自研芯片战略,其 Trainium 芯片已支撑 Bedrock 平台超 50% 的 Token 使用量,既降低对英伟达依赖,又大幅优化成本效益。

Trainium 成功的关键在于两点:一是 Bedrock 屏蔽底层硬件细节,客户仅关注 Token 服务,让 AWS 可灵活选用高性价比硬件方案;二是芯片针对推理、强化学习场景优化,侧重内存带宽适配,模型移植成本可通过规模化部署覆盖。此外,AWS Graviton CPU 在 AI 场景价值凸显,第五代产品在性能与总体拥有成本上优势显著,Graviton4 将集成至 Trainium3 作为主节点,同时承接强化学习、智能代理等工作负载,AWS 已与多家头部 AI 企业签订大规模芯片采购合约。
自研芯片的成功有明确前提:云厂商需具备大规模自有业务,通过规模效应分摊研发成本,针对自身负载深度优化。反观国内市场,云厂商纷纷布局自研芯片,第三方 AI 芯片企业数量众多,但除头部企业外销量普遍偏低,行业竞争趋于白热化。
Google TPU 则提供了反面参考:尽管支撑 Gemini、Claude 两大顶级模型训练,技术实力不俗,但生态不成熟导致 Midjourney 开发进度延迟一年,团队坦言若重新选择会优先英伟达 CUDA 生态。同时 Google 多线竞争分散资源,云业务算力容量受限,且 TPU 以硬件销售、IP 授权为主,盈利模式远不如 AWS 持续服务收益优质。
三、三大云厂商:容量与策略决定市场终局

AI 云竞争的核心已转向算力容量建设,三大厂商呈现截然不同的发展态势:
•AWS:激进扩张算力规模,签订数十亿美元电力采购协议,与多家电力企业保障能源供应,采用模块化、预制化数据中心设计,印第安纳州、密西西比州集群建设速度领先,2025-2027 年算力容量将远超竞争对手。
•Microsoft:经历长达一年的数据中心建设暂停,2027 年容量预期下调,威斯康星州 AI 集群进度缓慢。大量算力被 OpenAI 长期合约锁定,外部可用容量不足,被迫从 Coreweave 等厂商高价租赁算力,进一步压缩利润空间。
•Google Cloud:近期收入增长超 60%、利润率创新高,但存在成本核算偏差。超百亿美元 AI 研发成本计入 Alphabet 集团层面,未分摊至云业务,若合理分配成本,其利润率优势将大幅缩水。
四、生态关系重构:独家合作价值衰减,平台能力成核心
微软与 OpenAI 的合作关系正在发生关键转变,从独家 IP 合作转向多模型平台策略,Azure 现已接入 Anthropic、DeepSeek 等多家模型。微软核心产品如 GitHub Copilot、Office Copilot 具备模型无关性,底层算力可灵活替换,不再被单一模型绑定。
OpenAI 则推行多云策略,与 Oracle、Cerebras 等多家云厂商合作,虽拓宽算力来源,但削弱了与微软独家合作的价值。这一趋势印证:AI 基础设施领域,独家合作的价值持续下降,平台整合能力、生态完善度成为竞争核心。
五、模型竞争终局:商品化后价值向平台迁移
当前主流 AI 模型性能差距快速缩小,原本需 1-2 年的技术迭代,如今 3-6 个月即可实现,预计未来两年通用场景下模型质量将趋于一致。以编程场景为例,主流代码助手能力差距持续收窄,一年内有望实现场景 “标准化”。
模型商品化将带来两大变化:一是价格竞争加剧,定价权向客户端转移;二是竞争焦点上移,转向生态整合、企业服务、合规安全等平台能力。这与视频处理行业发展路径相似,硬件性能达标后,竞争核心转向软件生态与用户体验,AI 模型终将成为基础工具,真正价值体现在业务集成、合规保障、稳定运行等平台服务中。
企业 AI 部署的核心壁垒并非模型本身,而是完整的平台能力:企业更关注数据安全、合规适配、权限管理、智能代理运维等问题。数据迁移成本高企,叠加智能代理对身份认证、操作审计的刚性需求,让 Azure、AWS 等大型云平台凭借全栈解决方案占据优势,模型质量仅为次要考量因素。
六、商业模式深层逻辑:企业与消费市场的盈利分化
AI 云服务盈利逻辑在企业与消费市场呈现巨大差异:
•企业市场:付费意愿强,服务溢价空间大,硬件迭代、软件优化、智能代理效率提升持续降低成本,云厂商定价灵活度高。企业对价格敏感度低,更看重服务稳定性、兼容性与技术支持,迁移意愿较弱。需关注智能代理场景下 Token 消耗过高问题,部分企业已开始设置 Token 预算限制单任务消耗。
•消费市场:盈利难度大,免费用户推理成本高昂,付费用户单价偏低,广告为主要盈利模式。OpenAI 因大量免费用户持续亏损,而 Anthropic 聚焦企业 API 业务,消费者业务占比低,有望在 2026 年二季度实现运营盈利(调整股权激励后)。
综上,AI 云服务的核心启示在于:商业模式选择比技术优势更关键。TaaS 模式凭借 55% 的高利润率,彻底超越传统 IaaS 业务,国内算力租赁厂商可借鉴 AWS 与 Anthropic 的合作路径,从单纯硬件租赁转向 Token 服务运营,结合自研芯片、生态整合构建盈利壁垒,才能在 AI 算力变革中占据先机。
最后,真诚交个朋友!
我是连续创业者,过去两年为20+金融科技/AI项目提供全球化增长策略(从硅谷量化基金到新加坡AIAgent团队),现决定AI-In金融AI赛道。
我的定位是CFO(首席未来官),专注战略布局与生态合作,正寻找:
技术驱动的CEO:深耕AI/量化交易,有产品规模化经验
极客型CTO:熟悉LLM、Multi-Agent在金融场景的工程化落地。如果你对「AI投顾」「自动化交易Agent」或「金融数字员工」方向感兴趣,欢迎公众号后台回复【合伙人】加微信—可聊赛道、聊资源,甚至聊通宵的 AGI金融化脑暴。