B300半年涨73.8%背后:算力市场的底层逻辑与2026下半年判断

引言

2026年的算力市场，用”疯狂”两个字形容毫不为过。

年初还在360万元/台左右徘徊的英伟达B300，到6月份已经摸到了620万元的高位，半年涨幅高达73.8% 。这个涨幅，不仅跑赢了所有大宗商品，甚至超过了过去三年深圳核心区的房价涨幅。

更魔幻的是，涨价的不只是B300：

H100从年初的约80万/张涨到了110万+，涨幅超40%
华为昇腾910B全线缺货，二手市场溢价20%以上
就连曾经被视为”消费级”的RTX 4090，租赁价格也从年初的6000元/月涨到了现在的6500-7000元/月

很多人把这轮涨价归因于”炒卡”、”中间商囤货”，但如果你真的深入行业一线就会发现：这不是泡沫，而是真实的供需失衡。

算力正在从”互联网公司的成本中心”，变成”数字经济的核心生产资料”。这个转变过程中，价格波动只是表象，底层的产业逻辑正在发生不可逆的变化。

今天这篇文章，我们就来拆解三个核心问题：

这轮算力涨价的底层逻辑到底是什么？
2026年下半年，算力市场会怎么走？
作为从业者，我们该如何应对，才能踩对趋势而不是被甩下车？

一、本轮算力涨价的三重底层逻辑

很多人分析算力涨价，只会说”AI火了所以GPU涨价”，这是典型的现象级描述，没有触及本质。

这轮涨价，是需求爆发、供给约束、渠道放大三重因素叠加的结果，每一层都有深刻的产业背景。

1. 需求端：训练+推理双轮驱动，算力需求指数级增长

过去三年，算力需求的主要驱动力是大模型训练。GPT-3、GPT-4、文心一言、通义千问… 每一个千亿级参数大模型的背后，都是成千上万张GPU堆出来的。

但从2025年下半年开始，一个新的趋势出现了：推理算力需求的增速，首次超过了训练算力。

这个转变非常关键，意味着算力需求从”阶段性脉冲”变成了”持续性刚性需求”。

我们来看一组数据：

2025年，全球AI算力需求中，训练占比约65%，推理占比35%
2026年Q1，这个比例已经变成了训练48%，推理52%
预计到2026年底，推理占比将达到60%以上

为什么推理需求爆发得这么快？

因为AI应用终于开始赚钱了。

从AI生成式内容（AIGC）到AI客服、AI编程、AI设计，再到自动驾驶、AI制药、智慧矿山… 越来越多的行业开始把AI真正用起来，而不是停留在PPT和概念阶段。

每一个AI应用的背后，都是7×24小时运行的推理算力需求。这种需求是持续的、稳定的、增长的，它不像大模型训练那样项目结束就释放算力，而是会随着用户量的增长线性增长。

除此之外，端侧AI的兴起又给需求添了一把火。AI手机、AI PC、AI机器人、智能驾驶… 这些终端设备本身的算力有限，大量的计算任务需要卸载到边缘算力节点，这又催生了新的边缘算力需求。

一句话总结：算力需求已经从”大厂奢侈品”变成了”行业刚需”，需求的盘子变大了，而且还在快速变大。

2. 供给端：产能瓶颈+地缘管制，高端GPU供给有硬约束

需求在爆发，但供给却跟不上。

高端GPU的生产，是一个全球分工的复杂链条：设计在英伟达/AMD/华为，代工在台积电，封测在日月光/长电，最后组装成服务器和集群。

这里面最卡脖子的环节，就是台积电的先进制程产能。

无论是英伟达的H100/H200/B300，还是华为的910B/910C，都需要台积电的5nm/3nm工艺。而台积电的先进制程产能，是有限的，而且扩产周期非常长——新建一座晶圆厂，从动工到量产，至少需要2-3年时间。

更雪上加霜的是，地缘政治因素给供给增加了更多不确定性。从2022年开始，美国不断升级对华高端芯片出口管制，从A100/H100到H800/A800，再到现在的B300，管制范围越来越大，门槛越来越高。

虽然国产算力正在加速替代，但客观来说，目前国产高端GPU的性能和产能，还不能完全满足市场需求。华为昇腾910B的性能大概相当于H100的60-70%，但产能一直处于爬坡阶段，供不应求。

910C虽然已经发布，性能对标H100的80%以上，但大规模量产可能要等到2026年Q3甚至Q4。

这就导致了一个尴尬的局面：高端进口卡拿不到，国产高端卡产能不够，中低端卡又满足不了大模型训练需求。供需缺口就这样被拉大了。

3. 渠道端：锁仓+惜售，供需错配被人为放大

如果说需求和供给是基本面，那渠道层面的行为，就是这轮涨价的”放大器”。

第一个现象是大厂锁单。

云厂商和大模型公司，为了保证自己的算力供应，会提前半年甚至一年，向英伟达或其代理商锁定产能。这些被锁定的产能，不会进入现货市场流通，直接导致现货市场的供应量大幅减少。

比如某头部云厂商，2026年的GPU采购量超过10万张，其中大部分是提前锁的期货。这么大的采购量，自然会挤占其他中小客户的份额。

第二个现象是渠道惜售。

当市场形成一致的涨价预期时，手里有货的渠道商，自然会选择”捂货惜售”——反正每天都在涨，晚卖几天就能多赚几十万，为什么要急着卖？

这种行为进一步减少了现货市场的流通量，形成了”越涨越惜售，越惜售越涨”的循环。

第三个现象是期货市场混乱。

因为现货紧缺，很多开始卖期货，交货周期从8周到28周不等，价格差甚至能超过200万/台。这里面鱼龙混杂，有真有渠道的，也有纯粹倒空卖空的，进一步加剧了市场的恐慌情绪。

（未完待续，第二部分：2026下半年三大趋势判断）

二、2026下半年算力市场三大趋势判断

看懂了底层逻辑，我们再来看下半年的趋势。很多人会问：现在价格已经这么高了，还会继续涨吗？还是会回调？

我的判断是：整体紧平衡的格局不会变，但结构性机会和风险并存。具体来说，有三个确定性比较高的趋势。

趋势1：国产算力加速渗透，910系列成为市场主力

这是我认为2026年下半年，算力行业最重要的趋势，没有之一。

过去三年，国产算力一直在”喊口号”阶段——性能不够、生态不完善、客户不敢用。但从2025年下半年开始，情况发生了质变。

首先是性能追上来了。华为昇腾910B的性能，已经达到H100的60-70%，而910C的性能更是能到H100的80%以上。对于大部分训练和推理场景来说，这个性能完全够用了。

更重要的是价格优势。910B的整机价格，大概是H100的1/3左右，性价比非常突出。对于预算有限的中小企业和创业公司来说，910B几乎是最优选择。

其次是生态慢慢起来了。过去用国产GPU最大的痛点是生态差——很多框架不兼容，模型迁移成本高。但现在，随着大模型厂商纷纷做国产适配，这个问题正在快速解决。

比如阿里的通义、百度的文心、智谱的GLM，都已经完成了对昇腾910的适配。很多垂直行业的大模型，也开始优先考虑国产算力。

最后也是最关键的：政策驱动。

国企、政府、金融、能源等关键行业，已经明确要求优先采购国产算力。这个趋势在2026年下半年会进一步加速，甚至会有更多具体的扶持政策出台。

我得到的消息是，华为昇腾2026年的出货目标是300万片，其中下半年的产能会比上半年增长50%以上。

判断：2026年底，国产算力在国内市场的占比，将从当前的20%左右，提升到40%以上。910系列将成为中端算力市场的绝对主力。

对于从业者来说，这是未来三年最确定的赛道——早布局，早受益。

趋势2：推理算力占比超60%，性价比机型成市场刚需

第二个趋势，是推理算力的崛起。

我在前面说过，2026年Q1，推理算力的占比已经超过了训练算力。这个趋势在下半年会进一步强化，预计到年底，推理算力占比将达到60%以上。

这个变化带来的直接影响是：市场对GPU的需求，从”追求极致性能”转向”追求性价比”。

大模型训练，需要的是H100、H200、B300这种旗舰级GPU，性能越强越好。但推理场景不一样，推理更看重的是单位算力的成本、能效比，以及稳定性。

对于大部分推理场景来说，4090、910B、5090这种中高端GPU，反而比旗舰卡更具性价比。

举个例子：

一张H100，租赁价格约12万/月，FP16算力约1979 TFLOPS
一张910B，租赁价格约3.5万/月，FP16算力约1024 TFLOPS

算下来，910B的单位算力成本，只有H100的一半左右。对于对时延要求不是极高的推理场景来说，910B显然是更优选择。

而且，推理场景的需求是碎片化的、多样化的，不是只有大公司才有需求——中小企业、创业团队、甚至个人开发者，都有推理算力需求。

这就意味着，性价比机型的市场盘子会越来越大，需求会越来越旺盛。

判断：2026下半年，4090、910B、5090等性价比机型，将继续处于供不应求的状态，价格会保持坚挺甚至继续上涨。而高端旗舰卡的价格，可能会因为新卡发布和需求结构变化，出现一定的波动。

趋势3：算力服务化加速，从”卖硬件”到”卖算力”转变

第三个趋势，是算力供给模式的变化。

过去，算力的买卖方式很简单：你买卡，我卖卡；你租服务器，我给你服务器。大家比拼的是谁的卡多、谁的价格低。

但现在，用户的需求正在发生变化。

越来越多的用户，不再关心你用的是什么型号的GPU，也不想自己去运维集群、调优框架。他们只关心一件事：我需要100P算力，多少钱？稳定不稳定？什么时候能用上？

换句话说，算力正在从”硬件产品”变成”标准化服务”。

这个趋势，我们称之为”算力服务化”，或者叫”算力即服务”(CaaS, Computing as a Service)。

算力服务化的核心是：

按需付费：用多少付多少，不用一次性投入重金买卡
弹性扩容：需要的时候加，不需要的时候减，灵活高效
开箱即用：框架、环境、驱动都帮你装好，拿到手就能用
专业运维：7×24小时运维，出问题有人管，不用自己招运维团队

对于中小企业和创业公司来说，这种模式太友好了——不用承担硬件贬值的风险，不用养运维团队，按需使用，成本可控。

判断：2026下半年，算力租赁、算力服务的市场增速，将远超硬件销售的增速。纯倒卡、纯撮合的生意会越来越难做，而能提供稳定、可靠、高性价比算力服务的公司，会迎来快速增长。

三、给算力从业者的三个落地建议

讲完了逻辑和趋势，最后说点实在的：作为算力行业的从业者，我们该怎么办？

是继续囤卡赌涨价？还是转型做服务？或者干脆离场？

我的建议是：顺势而为，升级迭代，做时间的朋友。具体来说，有三个落地建议。

建议1：All in 国产算力赛道，提前锁定优质货源

未来三年，国内算力行业最大的确定性，就是国产替代。

这个趋势，不是谁能阻挡的——既有政策的强力推动，也有供应链安全的现实需求，更有国产算力自身性能提升的支撑。

现在的国产算力，就像2019年的新能源汽车——看起来还有这样那样的问题，但趋势已经起来了，而且会越来越快。

所以，如果你还在纠结”国产算力行不行”，我劝你别纠结了，赶紧下场。早布局一天，就多一天的红利。

具体怎么做？

货源上：多对接国产算力的渠道，比如华为昇腾的代理商、寒武纪的合作伙伴、海光的经销商，建立稳定的供货关系
技术上：学习国产算力的部署、调优、运维，建立自己的技术能力
客户上：重点开拓国企、政府、金融等对国产化有要求的客户，这些客户的预算足、需求稳、忠诚度高

记住一句话：国产替代的红利，只属于早布局的人。等所有人都觉得国产算力行了，那时候也就没你什么事了。

建议2：放弃纯撮合模式，向”算力服务提供商”升级

第二个建议，是放弃纯撮合、纯倒卡的模式，往价值链的上游走。

我见过很多做算力的朋友，本质上就是个”倒爷”——左手找货源，右手找客户，赚个差价。这种模式在行业红利期确实能赚钱，但一旦行业波动，最先死的就是这批人。

为什么？因为纯撮合没有任何壁垒。

你能拿到的货，别人也能拿到
你能找到的客户，别人也能找到
最后只能拼价格，利润越来越薄

而且，随着算力服务化的趋势，客户越来越需要的是”解决方案”，而不是”一堆显卡”。

所以，你必须升级。

从”卖卡”升级到”卖算力”：做算力租赁、按需付费
从”卖硬件”升级到”卖服务”：提供部署、运维、调优、框架适配等增值服务
从”什么客户都做”升级到”聚焦垂直行业”：比如专注AI制药、自动驾驶、AIGC等某个细分领域，做深做透

升级之后，你会发现：客户更稳定了，利润更高了，生意更好做了。

建议3：关注边缘算力和AI终端的结构性机会

第三个建议，是多关注边缘算力和AI终端的机会，不要只盯着数据中心的那点生意。

很多人做算力，眼睛里就只有大模型训练、只有数据中心、只有H100/B300。但实际上，随着AI的普及，算力的形态正在变得越来越多样化。

其中最大的结构性机会，就是边缘算力。

什么是边缘算力？就是部署在靠近用户的地方，提供低时延、高带宽算力服务的节点。比如5G基站旁边的算力机房、园区里的算力中心、甚至小区里的边缘节点。

为什么边缘算力会爆发？

因为AI应用越来越多，很多应用对时延要求很高——比如自动驾驶、云游戏、AR/VR、工业视觉… 这些应用如果把数据传到千里之外的数据中心去算，时延根本受不了，必须在边缘节点处理。

而且，端侧AI的爆发，也会带动边缘算力的需求。手机、PC、机器人这些终端设备，本身算力有限，复杂的计算任务需要卸载到边缘节点。

这个市场现在还处于早期阶段，玩家不多，竞争不激烈，利润空间也不错。对于中小从业者来说，这是一个非常好的切入方向。

最后

算力行业，正在经历一场百年未有之大变局。

从需求侧看，AI爆发带动算力需求指数级增长；从供给侧看，地缘政治和产能瓶颈带来硬约束；从模式侧看，算力正在从硬件产品变成标准化服务。

这是一个充满机会的时代，也是一个充满风险的时代。

有人靠囤卡赚得盆满钵满，也有人因为赌错方向血本无归；有人借国产替代的东风快速崛起，也有人固守旧模式被时代淘汰。

但我始终相信：长期来看，那些真正创造价值的人，才能走得更远。

我们做「算力落地指南」这个IP的初衷，也是想帮大家少走点弯路，多做点真正有价值的事。

我们不炒概念，不讲故事，只讲能落地的算力干货。

我们有一手的货源，有落地的经验，有人脉资源，也愿意分享。

如果你需要算力选型、货源对接、项目落地，欢迎随时交流。

让我们一起，在算力这个万亿级的赛道上，做点真正有价值的事。

「算力落地指南」—— 只讲能落地的算力干货。