B300半年涨73.8%背后:算力市场的底层逻辑与2026下半年判断


B300半年涨73.8%背后:算力市场的底层逻辑与2026下半年判断

引言

2026年的算力市场,用”疯狂”两个字形容毫不为过。

年初还在360万元/台左右徘徊的英伟达B300,到6月份已经摸到了620万元的高位,半年涨幅高达73.8% 。这个涨幅,不仅跑赢了所有大宗商品,甚至超过了过去三年深圳核心区的房价涨幅。

更魔幻的是,涨价的不只是B300:

H100从年初的约80万/张涨到了110万+,涨幅超40%
华为昇腾910B全线缺货,二手市场溢价20%以上
就连曾经被视为”消费级”的RTX 4090,租赁价格也从年初的6000元/月涨到了现在的6500-7000元/月

很多人把这轮涨价归因于”炒卡”、”中间商囤货”,但如果你真的深入行业一线就会发现:这不是泡沫,而是真实的供需失衡。

算力正在从”互联网公司的成本中心”,变成”数字经济的核心生产资料”。这个转变过程中,价格波动只是表象,底层的产业逻辑正在发生不可逆的变化。

今天这篇文章,我们就来拆解三个核心问题:

这轮算力涨价的底层逻辑到底是什么?
2026年下半年,算力市场会怎么走?
作为从业者,我们该如何应对,才能踩对趋势而不是被甩下车?

一、本轮算力涨价的三重底层逻辑

很多人分析算力涨价,只会说”AI火了所以GPU涨价”,这是典型的现象级描述,没有触及本质。

这轮涨价,是需求爆发、供给约束、渠道放大三重因素叠加的结果,每一层都有深刻的产业背景。

1. 需求端:训练+推理双轮驱动,算力需求指数级增长

过去三年,算力需求的主要驱动力是大模型训练。GPT-3、GPT-4、文心一言、通义千问… 每一个千亿级参数大模型的背后,都是成千上万张GPU堆出来的。

但从2025年下半年开始,一个新的趋势出现了:推理算力需求的增速,首次超过了训练算力。

这个转变非常关键,意味着算力需求从”阶段性脉冲”变成了”持续性刚性需求”。

我们来看一组数据:

2025年,全球AI算力需求中,训练占比约65%,推理占比35%
2026年Q1,这个比例已经变成了训练48%,推理52%
预计到2026年底,推理占比将达到60%以上

为什么推理需求爆发得这么快?

因为AI应用终于开始赚钱了。

从AI生成式内容(AIGC)到AI客服、AI编程、AI设计,再到自动驾驶、AI制药、智慧矿山… 越来越多的行业开始把AI真正用起来,而不是停留在PPT和概念阶段。

每一个AI应用的背后,都是7×24小时运行的推理算力需求。这种需求是持续的、稳定的、增长的,它不像大模型训练那样项目结束就释放算力,而是会随着用户量的增长线性增长。

除此之外,端侧AI的兴起又给需求添了一把火。AI手机、AI PC、AI机器人、智能驾驶… 这些终端设备本身的算力有限,大量的计算任务需要卸载到边缘算力节点,这又催生了新的边缘算力需求。

一句话总结:算力需求已经从”大厂奢侈品”变成了”行业刚需”,需求的盘子变大了,而且还在快速变大。

2. 供给端:产能瓶颈+地缘管制,高端GPU供给有硬约束

需求在爆发,但供给却跟不上。

高端GPU的生产,是一个全球分工的复杂链条:设计在英伟达/AMD/华为,代工在台积电,封测在日月光/长电,最后组装成服务器和集群。

这里面最卡脖子的环节,就是台积电的先进制程产能。

无论是英伟达的H100/H200/B300,还是华为的910B/910C,都需要台积电的5nm/3nm工艺。而台积电的先进制程产能,是有限的,而且扩产周期非常长——新建一座晶圆厂,从动工到量产,至少需要2-3年时间。

更雪上加霜的是,地缘政治因素给供给增加了更多不确定性。从2022年开始,美国不断升级对华高端芯片出口管制,从A100/H100到H800/A800,再到现在的B300,管制范围越来越大,门槛越来越高。

虽然国产算力正在加速替代,但客观来说,目前国产高端GPU的性能和产能,还不能完全满足市场需求。华为昇腾910B的性能大概相当于H100的60-70%,但产能一直处于爬坡阶段,供不应求。

910C虽然已经发布,性能对标H100的80%以上,但大规模量产可能要等到2026年Q3甚至Q4。

这就导致了一个尴尬的局面:高端进口卡拿不到,国产高端卡产能不够,中低端卡又满足不了大模型训练需求。 供需缺口就这样被拉大了。

3. 渠道端:锁仓+惜售,供需错配被人为放大

如果说需求和供给是基本面,那渠道层面的行为,就是这轮涨价的”放大器”。

第一个现象是大厂锁单。

云厂商和大模型公司,为了保证自己的算力供应,会提前半年甚至一年,向英伟达或其代理商锁定产能。这些被锁定的产能,不会进入现货市场流通,直接导致现货市场的供应量大幅减少。

比如某头部云厂商,2026年的GPU采购量超过10万张,其中大部分是提前锁的期货。这么大的采购量,自然会挤占其他中小客户的份额。

第二个现象是渠道惜售。

当市场形成一致的涨价预期时,手里有货的渠道商,自然会选择”捂货惜售”——反正每天都在涨,晚卖几天就能多赚几十万,为什么要急着卖?

这种行为进一步减少了现货市场的流通量,形成了”越涨越惜售,越惜售越涨”的循环。

第三个现象是期货市场混乱。

因为现货紧缺,很多开始卖期货,交货周期从8周到28周不等,价格差甚至能超过200万/台。这里面鱼龙混杂,有真有渠道的,也有纯粹倒空卖空的,进一步加剧了市场的恐慌情绪。

(未完待续,第二部分:2026下半年三大趋势判断)

二、2026下半年算力市场三大趋势判断

看懂了底层逻辑,我们再来看下半年的趋势。很多人会问:现在价格已经这么高了,还会继续涨吗?还是会回调?

我的判断是:整体紧平衡的格局不会变,但结构性机会和风险并存。 具体来说,有三个确定性比较高的趋势。

趋势1:国产算力加速渗透,910系列成为市场主力

这是我认为2026年下半年,算力行业最重要的趋势,没有之一。

过去三年,国产算力一直在”喊口号”阶段——性能不够、生态不完善、客户不敢用。但从2025年下半年开始,情况发生了质变。

首先是性能追上来了。华为昇腾910B的性能,已经达到H100的60-70%,而910C的性能更是能到H100的80%以上。对于大部分训练和推理场景来说,这个性能完全够用了。

更重要的是价格优势。910B的整机价格,大概是H100的1/3左右,性价比非常突出。对于预算有限的中小企业和创业公司来说,910B几乎是最优选择。

其次是生态慢慢起来了。过去用国产GPU最大的痛点是生态差——很多框架不兼容,模型迁移成本高。但现在,随着大模型厂商纷纷做国产适配,这个问题正在快速解决。

比如阿里的通义、百度的文心、智谱的GLM,都已经完成了对昇腾910的适配。很多垂直行业的大模型,也开始优先考虑国产算力。

最后也是最关键的:政策驱动。

国企、政府、金融、能源等关键行业,已经明确要求优先采购国产算力。这个趋势在2026年下半年会进一步加速,甚至会有更多具体的扶持政策出台。

我得到的消息是,华为昇腾2026年的出货目标是300万片,其中下半年的产能会比上半年增长50%以上。

判断:2026年底,国产算力在国内市场的占比,将从当前的20%左右,提升到40%以上。910系列将成为中端算力市场的绝对主力。

对于从业者来说,这是未来三年最确定的赛道——早布局,早受益。

趋势2:推理算力占比超60%,性价比机型成市场刚需

第二个趋势,是推理算力的崛起。

我在前面说过,2026年Q1,推理算力的占比已经超过了训练算力。这个趋势在下半年会进一步强化,预计到年底,推理算力占比将达到60%以上。

这个变化带来的直接影响是:市场对GPU的需求,从”追求极致性能”转向”追求性价比”。

大模型训练,需要的是H100、H200、B300这种旗舰级GPU,性能越强越好。但推理场景不一样,推理更看重的是单位算力的成本、能效比,以及稳定性。

对于大部分推理场景来说,4090、910B、5090这种中高端GPU,反而比旗舰卡更具性价比。

举个例子:

一张H100,租赁价格约12万/月,FP16算力约1979 TFLOPS
一张910B,租赁价格约3.5万/月,FP16算力约1024 TFLOPS

算下来,910B的单位算力成本,只有H100的一半左右。对于对时延要求不是极高的推理场景来说,910B显然是更优选择。

而且,推理场景的需求是碎片化的、多样化的,不是只有大公司才有需求——中小企业、创业团队、甚至个人开发者,都有推理算力需求。

这就意味着,性价比机型的市场盘子会越来越大,需求会越来越旺盛。

判断:2026下半年,4090、910B、5090等性价比机型,将继续处于供不应求的状态,价格会保持坚挺甚至继续上涨。而高端旗舰卡的价格,可能会因为新卡发布和需求结构变化,出现一定的波动。

趋势3:算力服务化加速,从”卖硬件”到”卖算力”转变

第三个趋势,是算力供给模式的变化。

过去,算力的买卖方式很简单:你买卡,我卖卡;你租服务器,我给你服务器。大家比拼的是谁的卡多、谁的价格低。

但现在,用户的需求正在发生变化。

越来越多的用户,不再关心你用的是什么型号的GPU,也不想自己去运维集群、调优框架。他们只关心一件事:我需要100P算力,多少钱?稳定不稳定?什么时候能用上?

换句话说,算力正在从”硬件产品”变成”标准化服务”。

这个趋势,我们称之为”算力服务化”,或者叫”算力即服务”(CaaS, Computing as a Service)。

算力服务化的核心是:

按需付费:用多少付多少,不用一次性投入重金买卡
弹性扩容:需要的时候加,不需要的时候减,灵活高效
开箱即用:框架、环境、驱动都帮你装好,拿到手就能用
专业运维:7×24小时运维,出问题有人管,不用自己招运维团队

对于中小企业和创业公司来说,这种模式太友好了——不用承担硬件贬值的风险,不用养运维团队,按需使用,成本可控。

判断:2026下半年,算力租赁、算力服务的市场增速,将远超硬件销售的增速。纯倒卡、纯撮合的生意会越来越难做,而能提供稳定、可靠、高性价比算力服务的公司,会迎来快速增长。

三、给算力从业者的三个落地建议

讲完了逻辑和趋势,最后说点实在的:作为算力行业的从业者,我们该怎么办?

是继续囤卡赌涨价?还是转型做服务?或者干脆离场?

我的建议是:顺势而为,升级迭代,做时间的朋友。 具体来说,有三个落地建议。

建议1:All in 国产算力赛道,提前锁定优质货源

未来三年,国内算力行业最大的确定性,就是国产替代。

这个趋势,不是谁能阻挡的——既有政策的强力推动,也有供应链安全的现实需求,更有国产算力自身性能提升的支撑。

现在的国产算力,就像2019年的新能源汽车——看起来还有这样那样的问题,但趋势已经起来了,而且会越来越快。

所以,如果你还在纠结”国产算力行不行”,我劝你别纠结了,赶紧下场。早布局一天,就多一天的红利。

具体怎么做?

货源上:多对接国产算力的渠道,比如华为昇腾的代理商、寒武纪的合作伙伴、海光的经销商,建立稳定的供货关系
技术上:学习国产算力的部署、调优、运维,建立自己的技术能力
客户上:重点开拓国企、政府、金融等对国产化有要求的客户,这些客户的预算足、需求稳、忠诚度高

记住一句话:国产替代的红利,只属于早布局的人。 等所有人都觉得国产算力行了,那时候也就没你什么事了。

建议2:放弃纯撮合模式,向”算力服务提供商”升级

第二个建议,是放弃纯撮合、纯倒卡的模式,往价值链的上游走。

我见过很多做算力的朋友,本质上就是个”倒爷”——左手找货源,右手找客户,赚个差价。这种模式在行业红利期确实能赚钱,但一旦行业波动,最先死的就是这批人。

为什么?因为纯撮合没有任何壁垒。

你能拿到的货,别人也能拿到
你能找到的客户,别人也能找到
最后只能拼价格,利润越来越薄

而且,随着算力服务化的趋势,客户越来越需要的是”解决方案”,而不是”一堆显卡”。

所以,你必须升级。

从”卖卡”升级到”卖算力”:做算力租赁、按需付费
从”卖硬件”升级到”卖服务”:提供部署、运维、调优、框架适配等增值服务
从”什么客户都做”升级到”聚焦垂直行业”:比如专注AI制药、自动驾驶、AIGC等某个细分领域,做深做透

升级之后,你会发现:客户更稳定了,利润更高了,生意更好做了。

建议3:关注边缘算力和AI终端的结构性机会

第三个建议,是多关注边缘算力和AI终端的机会,不要只盯着数据中心的那点生意。

很多人做算力,眼睛里就只有大模型训练、只有数据中心、只有H100/B300。但实际上,随着AI的普及,算力的形态正在变得越来越多样化。

其中最大的结构性机会,就是边缘算力。

什么是边缘算力?就是部署在靠近用户的地方,提供低时延、高带宽算力服务的节点。比如5G基站旁边的算力机房、园区里的算力中心、甚至小区里的边缘节点。

为什么边缘算力会爆发?

因为AI应用越来越多,很多应用对时延要求很高——比如自动驾驶、云游戏、AR/VR、工业视觉… 这些应用如果把数据传到千里之外的数据中心去算,时延根本受不了,必须在边缘节点处理。

而且,端侧AI的爆发,也会带动边缘算力的需求。手机、PC、机器人这些终端设备,本身算力有限,复杂的计算任务需要卸载到边缘节点。

这个市场现在还处于早期阶段,玩家不多,竞争不激烈,利润空间也不错。对于中小从业者来说,这是一个非常好的切入方向。

最后

算力行业,正在经历一场百年未有之大变局。

从需求侧看,AI爆发带动算力需求指数级增长;从供给侧看,地缘政治和产能瓶颈带来硬约束;从模式侧看,算力正在从硬件产品变成标准化服务。

这是一个充满机会的时代,也是一个充满风险的时代。

有人靠囤卡赚得盆满钵满,也有人因为赌错方向血本无归;有人借国产替代的东风快速崛起,也有人固守旧模式被时代淘汰。

但我始终相信:长期来看,那些真正创造价值的人,才能走得更远。

我们做「算力落地指南」这个IP的初衷,也是想帮大家少走点弯路,多做点真正有价值的事。

我们不炒概念,不讲故事,只讲能落地的算力干货。

我们有一手的货源,有落地的经验,有人脉资源,也愿意分享。

如果你需要算力选型、货源对接、项目落地,欢迎随时交流。

让我们一起,在算力这个万亿级的赛道上,做点真正有价值的事。

「算力落地指南」—— 只讲能落地的算力干货。