AI云服务市场格局重塑:从算力租赁到Token服务的盈利变革

近期 AI 云服务市场呈现明显的利润分化态势，Oracle、Coreweave 等厂商盈利不及预期，Azure 利润率持续下滑，而 AWS 在 2026 年第一季度营业利润率环比大幅提升 213 个基点，核心驱动力正是其与 Anthropic 联手打造的Token-as-a-Service（TaaS） 新模式，这也为国内算力租赁厂商转型提供了重要参考方向。

一、TaaS 模式：颠覆传统算力租赁的盈利新范式

传统云服务以 IaaS 模式为主，企业签订长期合约租用 GPU 算力，收入稳定但利润率受硬件折旧、电力及运维成本严重挤压。AWS Bedrock 平台彻底打破这一格局，客户不再租赁硬件，而是直接采购模型生成的 Token 服务，以 Anthropic 旗下 Claude 模型为核心载体，构建了全新的收益体系。

AWS 在该合作中实现三重收益：

1.基础算力费用：对标传统 EC2 实例的基础设施使用费；

2.平台分成收益：作为模型分发渠道获取的服务佣金；

3.绩效激励分成：当 Anthropic 单兆瓦算力年化收入突破阈值后，获得额外奖励。

这种模式经济效益远超传统业务，SemiAnalysis 数据显示，2026 年第一季度 Anthropic 在 Bedrock 上每兆瓦算力年收入达 2600 万美元，平台 EBIT 利润率高达 55%，远高于传统 GPU 租赁业务。同时 Bedrock 增长迅猛，一季度、四季度收入环比分别增长 170%、60%，年化收入规模达 55亿美元，占据 AWS AI 业务 37% 份额，其中 80%-90% 客户使用 Claude 模型。

对比来看，Azure 与 Google Cloud AI 业务中传统 IaaS 占比超 80%，业务结构差异直接导致利润率差距。该模式对合作双方均有益处：Anthropic 无需签订高额长期算力合约，即可借助 AWS 企业客群快速扩张；AWS 虽放弃部分长期稳定收入，却收获更高利润率与市场灵活性，Anthropic 一季度新增年化经常性收入 210 亿美元，总 ARR 达 300 亿美元，推理业务毛利率从 2024 年 – 94% 飙升至2026 年 60% 以上，进一步放大 TaaS 模式优势。

二、自研芯片：AI 云厂商的核心竞争力分水岭

AWS 的盈利突破，离不开垂直整合的自研芯片战略，其 Trainium 芯片已支撑 Bedrock 平台超 50% 的 Token 使用量，既降低对英伟达依赖，又大幅优化成本效益。

Trainium 成功的关键在于两点：一是 Bedrock 屏蔽底层硬件细节，客户仅关注 Token 服务，让 AWS 可灵活选用高性价比硬件方案；二是芯片针对推理、强化学习场景优化，侧重内存带宽适配，模型移植成本可通过规模化部署覆盖。此外，AWS Graviton CPU 在 AI 场景价值凸显，第五代产品在性能与总体拥有成本上优势显著，Graviton4 将集成至 Trainium3 作为主节点，同时承接强化学习、智能代理等工作负载，AWS 已与多家头部 AI 企业签订大规模芯片采购合约。

自研芯片的成功有明确前提：云厂商需具备大规模自有业务，通过规模效应分摊研发成本，针对自身负载深度优化。反观国内市场，云厂商纷纷布局自研芯片，第三方 AI 芯片企业数量众多，但除头部企业外销量普遍偏低，行业竞争趋于白热化。

Google TPU 则提供了反面参考：尽管支撑 Gemini、Claude 两大顶级模型训练，技术实力不俗，但生态不成熟导致 Midjourney 开发进度延迟一年，团队坦言若重新选择会优先英伟达 CUDA 生态。同时 Google 多线竞争分散资源，云业务算力容量受限，且 TPU 以硬件销售、IP 授权为主，盈利模式远不如 AWS 持续服务收益优质。

三、三大云厂商：容量与策略决定市场终局

AI 云竞争的核心已转向算力容量建设，三大厂商呈现截然不同的发展态势：

•AWS：激进扩张算力规模，签订数十亿美元电力采购协议，与多家电力企业保障能源供应，采用模块化、预制化数据中心设计，印第安纳州、密西西比州集群建设速度领先，2025-2027 年算力容量将远超竞争对手。

•Microsoft：经历长达一年的数据中心建设暂停，2027 年容量预期下调，威斯康星州 AI 集群进度缓慢。大量算力被 OpenAI 长期合约锁定，外部可用容量不足，被迫从 Coreweave 等厂商高价租赁算力，进一步压缩利润空间。

•Google Cloud：近期收入增长超 60%、利润率创新高，但存在成本核算偏差。超百亿美元 AI 研发成本计入 Alphabet 集团层面，未分摊至云业务，若合理分配成本，其利润率优势将大幅缩水。

四、生态关系重构：独家合作价值衰减，平台能力成核心

微软与 OpenAI 的合作关系正在发生关键转变，从独家 IP 合作转向多模型平台策略，Azure 现已接入 Anthropic、DeepSeek 等多家模型。微软核心产品如 GitHub Copilot、Office Copilot 具备模型无关性，底层算力可灵活替换，不再被单一模型绑定。

OpenAI 则推行多云策略，与 Oracle、Cerebras 等多家云厂商合作，虽拓宽算力来源，但削弱了与微软独家合作的价值。这一趋势印证：AI 基础设施领域，独家合作的价值持续下降，平台整合能力、生态完善度成为竞争核心。

五、模型竞争终局：商品化后价值向平台迁移

当前主流 AI 模型性能差距快速缩小，原本需 1-2 年的技术迭代，如今 3-6 个月即可实现，预计未来两年通用场景下模型质量将趋于一致。以编程场景为例，主流代码助手能力差距持续收窄，一年内有望实现场景 “标准化”。

模型商品化将带来两大变化：一是价格竞争加剧，定价权向客户端转移；二是竞争焦点上移，转向生态整合、企业服务、合规安全等平台能力。这与视频处理行业发展路径相似，硬件性能达标后，竞争核心转向软件生态与用户体验，AI 模型终将成为基础工具，真正价值体现在业务集成、合规保障、稳定运行等平台服务中。

企业 AI 部署的核心壁垒并非模型本身，而是完整的平台能力：企业更关注数据安全、合规适配、权限管理、智能代理运维等问题。数据迁移成本高企，叠加智能代理对身份认证、操作审计的刚性需求，让 Azure、AWS 等大型云平台凭借全栈解决方案占据优势，模型质量仅为次要考量因素。

六、商业模式深层逻辑：企业与消费市场的盈利分化

AI 云服务盈利逻辑在企业与消费市场呈现巨大差异：

•企业市场：付费意愿强，服务溢价空间大，硬件迭代、软件优化、智能代理效率提升持续降低成本，云厂商定价灵活度高。企业对价格敏感度低，更看重服务稳定性、兼容性与技术支持，迁移意愿较弱。需关注智能代理场景下 Token 消耗过高问题，部分企业已开始设置 Token 预算限制单任务消耗。

•消费市场：盈利难度大，免费用户推理成本高昂，付费用户单价偏低，广告为主要盈利模式。OpenAI 因大量免费用户持续亏损，而 Anthropic 聚焦企业 API 业务，消费者业务占比低，有望在 2026 年二季度实现运营盈利（调整股权激励后）。

综上，AI 云服务的核心启示在于：商业模式选择比技术优势更关键。TaaS 模式凭借 55% 的高利润率，彻底超越传统 IaaS 业务，国内算力租赁厂商可借鉴 AWS 与 Anthropic 的合作路径，从单纯硬件租赁转向 Token 服务运营，结合自研芯片、生态整合构建盈利壁垒，才能在 AI 算力变革中占据先机。

最后，真诚交个朋友!

我是连续创业者，过去两年为20+金融科技/AI项目提供全球化增长策略(从硅谷量化基金到新加坡AIAgent团队)，现决定AI-In金融AI赛道。

我的定位是CFO(首席未来官)，专注战略布局与生态合作，正寻找:

技术驱动的CEO:深耕AI/量化交易，有产品规模化经验

极客型CTO:熟悉LLM、Multi-Agent在金融场景的工程化落地。如果你对「AI投顾」「自动化交易Agent」或「金融数字员工」方向感兴趣，欢迎公众号后台回复【合伙人】加微信—可聊赛道、聊资源，甚至聊通宵的 AGI金融化脑暴。