Token与算力:数据厂商如何控制市场?
在人工智能的浪潮中,Token(令牌/词元)和算力已成为比石油更珍贵的战略资源。Token是大模型理解世界的基本单位,算力则是驱动这一切的物理引擎。表面上看,这是一个百花齐放的AI创新时代,但深入肌理,我们会发现:算力生产资料正高度集中在少数巨头手中,而数据厂商(大模型公司)正在通过Token的定价权与算力的调配权,构建起隐形的市场控制力。
一、Token与算力的来源
Token是大模型处理文本、图像、视频等数据的最小单元。在训练阶段,模型的智能水平取决于消耗的Token数量——OpenAI等头部厂商的训练量已从万亿Token迈向数十万亿级别。在推理阶段,每一次用户提问、每一次API调用,都以Token为单位计费。Token本质上是大模型厂商的“产品”与“货币”。
算力则是生产Token的物理基础。它主要由三部分构成:
-
芯片:以英伟达GPU(图形处理器)为代表的AI加速卡,是算力的“发动机”。H100、B200等高端芯片决定了模型训练的速度与规模。
-
集群:成千上万张GPU通过高速互联(如InfiniBand)组成。
-
电力与散热:算力运行需要消耗巨量电力,液冷数据中心已成为稀缺资源。
简单来说:算力是生产资料,Token是产品,而大模型厂商就是通过租用或自建算力,产出Token出来并售卖的角色。
二、主要的云厂商与算力厂商:三层市场格局
当前的市场格局呈现清晰的“三层金字塔”结构:
|
|
|
|
|
|---|---|---|---|
| 底层 |
|
英伟达
|
|
| 中层 |
|
微软Azure
|
|
| 上层 |
|
|
|
这三层之间并非泾渭分明。微软既是云厂商(Azure),又是大模型厂商(通过投资OpenAI获得独家云权益); 谷歌则同时拥有云、自研芯片(TPU)和大模型(Gemini)的全栈能力。这种“垂直整合”趋势,正是控制力的体现。
三、谁掌握算力生产资料?
如果说算力是AI时代的“石油”,那么掌握生产资料的主体有两个:
1. 英伟达:
英伟达占据了AI训练芯片市场超过90%的份额。其护城河不仅在于硬件性能,更在于CUDA生态——十多年来积累的软件开发者生态,使得几乎所有大模型框架都天然优先适配英伟达芯片。这意味着,无论大模型厂商还是云厂商,短期内都无法绕过英伟达。英伟达通过控制高端芯片的出货节奏、定价权,实际上决定了整个行业算力的“基准成本”。
2. 云服务厂商:
微软、亚马逊、谷歌三大云巨头掌握了全球绝大多数的AI算力集群。它们以数十亿美元为单位采购英伟达芯片,建设超大规模数据中心,然后将算力以“租赁”形式提供给大模型厂商和初创公司。
控制力体现在分配上: 云厂商不仅决定谁能够租到稀缺的H100集群,还通过“算力+模型”的捆绑销售(如Azure OpenAI服务),将大模型厂商锁定在自己的生态中。对于无法自建万卡集群的初创大模型公司而言,云厂商就是它们的“水电煤”,一旦断供,训练即停摆。
四、隐藏的市场博弈
-
算力博弈:由于高端GPU供不应求,衍生出二手芯片交易、算力转租中介、甚至走私链条。在美国对华芯片出口管制背景下,中国AI公司通过海外实体租赁算力、或通过第三方转租获取稀缺算力的“灰色市场”悄然存在。算力成了类似硬通货的地下交易标的。
-
Token倒卖:大模型厂商的API调用通常按Token计费,但市场上出现了“Token倒卖”现象。部分拥有大量免费额度的开发者,将额度转售给小型创业公司,形成二级市场。此外,通过“爬取”大模型输出内容来构建数据集、甚至训练竞品模型的行为,也游走在知识产权与商业道德的灰色地带。
-
地缘政治导致的“算力孤岛”:美国对华芯片出口管制,使得中美两国实际上形成了两套算力生态体系。中国加速发展以华为昇腾为代表的国产算力,但在生态成熟度与集群规模上仍与英伟达存在差距。这种割裂导致全球算力市场被划分为“高算力区”与“受限区”,进一步强化了拥有先进芯片的少数主体的控制力。
五、未来展望
1. 算力层面:多元化与自研突围
英伟达的垄断地位正面临挑战。一方面,AMD、英特尔以及大量AI芯片创业公司(如Cerebras、Groq)正在推出专用架构;另一方面,云巨头(谷歌TPU、亚马逊Trainium、微软Maia)和大模型厂商(OpenAI自研芯片)纷纷自研芯片,试图摆脱对单一供应商的依赖。在中国,国产算力在政策驱动下加速替代。
2. 新的控制点:电力与人才
当芯片供应逐渐缓解后,算力的下一个瓶颈将是电力。超大规模数据中心的耗电量已堪比中小型城市,能否获得稳定的绿电配额,将成为未来算力集群布局的关键制约因素。同时,能够设计芯片、优化并行训练框架的顶尖AI人才,依然是比芯片更稀缺的生产资料。
3. 监管介入:算力作为一种公共资源
随着算力成为战略性基础设施,各国政府正试图介入其分配。例如,欧盟正在讨论“算力主权”法案,中国则通过“东数西算”工程布局算力网络。未来,算力可能像电网一样,由国家主导的基础设施进行调度,从而削弱单一企业的绝对控制力。


评论