市场消息分享-国产算力篇DeepSeek V4

一手调研纪要研报
请微信扫码小程序体验
加入小程序,您能够及时高效的
获取市场动态、政策解读、机构调研
搜索助力成长 消除信息差的焦虑
10W+机构调研资料等您查阅
深度挖掘具有极高增长潜力的标的
实现超额回报
国产算力:DeepSeek V4正式发布,华为超节点支撑利好国产算力链
一、开源模型性能与性价比实现双重突破: DeepSeek‑V4系列模型于2026年4月24日正式发布并开源,包含V4‑Pro与V4‑Flash两大版本,均原生支持100万token超长上下文,采用MIT开源协议。其中V4‑Pro参数规模达1.6万亿、激活参数49B,V4‑Flash参数规模284B、激活参数13B,预训练数据量均超32T。性能层面,V4系列在代码、数学、STEM领域达到开源模型顶尖水平,权威评测中超越多款主流闭源模型,长文本处理、Agent能力显著提升,且性价比突出。
2、华为昇腾950超节点深度适配:V4‑Pro单请求时延低至20ms、多并发吞吐达388TPS@21ms,V4‑Flash 单请求时延低于10ms、多并发吞吐达 4722TPS@20.15ms,可稳定支撑 8K 至 1M 全长度长序列应用,支持万卡级无收敛全互联扩展。华为950超节点支持V4核心优势源于三大底层技术突破:
1)是原生精度加速,全面支持# FP8、MXFP8、MXFP4 格式,在保障精度前提下内存占用降低 50% 以上、算力翻倍;
2)是稀疏访存优化,针对# MoE 模型离散访存特征强化硬件级稀疏访存,破解专家路由带宽瓶颈;
3)是Vector与Cube共享 Memory,创新存储架构消除片上数据搬运开销,显著降低端到端时延。该超节点与模型联合定义架构,系统性解决超长上下文推理的时延、吞吐与成本痛点,完成国产算力对万亿参数大模型的全流程支撑验证。
二、国产算力全产业链受益:我们认为
1)加速高端AI硬件国产替代,为高端封装载板等零部件提供替代空间;
2)超节点规模化放量,带动液冷设备等温控配套需求激增;
3)模型Token调用量提升推动算力扩容,进一步增加载板、液冷等上游环节的增量需求。
相关公司:
算力:海光信息、禾盛新材、寒武纪等;
上游:凌玮科技、德福科技、东材科技、宏和科技、联瑞新材、华正新材、川环科技、飞龙股份等;
第三方芯片测试:利扬芯片;
服务器:中科曙光;
算力租赁:利通电子、盈峰环境、协创数据、东阳光等。
风险提示:政策进展不及预期;下游需求不及预期;人工智能风险等。