市场消息分享-国产算力篇DeepSeek V4

一手调研纪要研报

请微信扫码小程序体验

加入小程序，您能够及时高效的

获取市场动态、政策解读、机构调研

搜索助力成长消除信息差的焦虑

10W+机构调研资料等您查阅

深度挖掘具有极高增长潜力的标的

实现超额回报

小程序日均实时更新200+投研资料

👇👇👇

【限时免费体验60分钟】

请联系在线客服（QQ：1535461409）

风险提示：以下信息均来自公开市场及券商机构观点的整理整合，一些流传的信息也可能存在被证伪的风险，且距离最初发布时间均有一定时滞，价格也可能充分反馈信息，切勿盲目追涨杀跌，以上内容更多是展示逻辑上的整合以便查阅思考及个人复盘记录所用，并不构成任何投资建议，投资有风险，入市需谨慎。

国产算力：DeepSeek V4正式发布，华为超节点支撑利好国产算力链

一、开源模型性能与性价比实现双重突破： DeepSeek‑V4系列模型于2026年4月24日正式发布并开源，包含V4‑Pro与V4‑Flash两大版本，均原生支持100万token超长上下文，采用MIT开源协议。其中V4‑Pro参数规模达1.6万亿、激活参数49B，V4‑Flash参数规模284B、激活参数13B，预训练数据量均超32T。性能层面，V4系列在代码、数学、STEM领域达到开源模型顶尖水平，权威评测中超越多款主流闭源模型，长文本处理、Agent能力显著提升，且性价比突出。

2、华为昇腾950超节点深度适配：V4‑Pro单请求时延低至20ms、多并发吞吐达388TPS@21ms，V4‑Flash 单请求时延低于10ms、多并发吞吐达 4722TPS@20.15ms，可稳定支撑 8K 至 1M 全长度长序列应用，支持万卡级无收敛全互联扩展。华为950超节点支持V4核心优势源于三大底层技术突破：

1）是原生精度加速，全面支持# FP8、MXFP8、MXFP4 格式，在保障精度前提下内存占用降低 50% 以上、算力翻倍；

2）是稀疏访存优化，针对# MoE 模型离散访存特征强化硬件级稀疏访存，破解专家路由带宽瓶颈；

3）是Vector与Cube共享 Memory，创新存储架构消除片上数据搬运开销，显著降低端到端时延。该超节点与模型联合定义架构，系统性解决超长上下文推理的时延、吞吐与成本痛点，完成国产算力对万亿参数大模型的全流程支撑验证。

二、国产算力全产业链受益：我们认为

1）加速高端AI硬件国产替代，为高端封装载板等零部件提供替代空间；

2）超节点规模化放量，带动液冷设备等温控配套需求激增；

3）模型Token调用量提升推动算力扩容，进一步增加载板、液冷等上游环节的增量需求。