市场再被点燃!DeepSeekV4“迟到”了,但国产AI等到了


市场再被点燃!DeepSeekV4“迟到”了,但国产AI等到了

本文深度梳理 DeepSeek 背后的故事:靠毫秒级交易赚钱的量化团队,为什么愿意花 180 天,造一条国产AI全新的路。

全文干货,建议先点赞收藏,转发给身边关注中国科技、AI 发展的朋友

2026 年 4 月 24 日,DeepSeek V4 终于来了。
万亿参数规模,百万级上下文窗口,首次深度适配昇腾国产芯片 —— 消息一出,国产 GPU 概念股直线拉升,中芯港股大涨 8.3%,华虹飙升近 19%,整个国产 AI 产业链再次被点燃
但如果你只看到了这些参数和盘面涨幅,就错过了这背后最精彩、也最提气的故事。
过去 180 天里,这家中国最神秘的 AI 公司,被质疑掉队、被唱衰没落,它到底在做什么? 

一、”矛盾” 的起点:用毫秒赚钱的人,做了件无期限的事!
要理解 DeepSeek,得先理解它的 “出身”。

深度求索脱胎于国内头部量化基金 —— 幻方量化。量化投资是什么?是以毫秒为单位计算的高频交易,光速都是需要被考虑的成本。能比别人快万分之一秒下单,就是真金白银的利润。

但偏偏,就是这样一个 “快到极致” 的行业,孕育出了一家 “慢到极致” 的 AI 公司。

创始人梁文锋,17 岁考入浙大,2008 年金融危机后开始用机器学习做量化交易,2015 年创立幻方量化,巅峰期管理规模达千亿级别。2019 到 2021 年间,他先后投入近 12 亿元打造 “萤火一号”” 萤火二号 “AI 训练平台,积累了上万张 A100 显卡规模的算力基础设施。

2023 年,梁文锋做了一个让全行业看不懂的决定 —— 创立深度求索,全力投入通用人工智能。

初创期完全依托幻方量化与创始团队自有资金,形成了 “无到期日” 的长期资本池,无需被季度营收、短期商业化绑架,唯一核心 KPI 是 AGI 底层技术的范式突破。

这是它能长期坚守底层研发、拒绝跟风做应用的核心底气。

一个靠 “快” 赚钱的人,选择了最 “慢” 的事业。

这种 “慢” 不是犹豫,而是一种有底气的笃定。幻方量化的利润,给了 DeepSeek 一种其他 AI 创业公司不具备的奢侈品 ——不被资本裹挟的自由。当别的 AI 公司还在为下一轮融资焦虑,为商业化路径发愁时,DeepSeek 可以把全部精力放在技术研发上。

梁文锋自己说过:”如果一定要找一个商业上的理由,它可能是找不到的,因为划不来……主要是好奇心驱动

从量化的毫秒级交易,到 AI 的无期限研发 —— 这是一种既矛盾、又合理的浪漫。


V4 跳票 180 天:不是掉队,是在 “推倒重来”
但”有钱任性”只是故事的序章。
2026年初,DeepSeek V4一再跳票。自2025年12月V3.2发布后,这款承载着长期记忆、工程级编程与原生多模态突破的旗舰模型迟迟未上线。
数据不会哄人:平台用户使用率从峰值7.5%掉到3%,官网流量一度下滑近三成,token调用量从42%萎缩到16%。曾经下载破亿、周活逼近9700万的App,在苹果效率榜上只排到第36位。
不少人开始问:那个一年前颠覆行业的DeepSeek,是不是不行了?
答案藏在另一个方向上。
多家国产模型供应商人士推断,V4的推迟,核心原因是——全面适配昇腾等国产芯片。
别的厂商,是在高速公路上踩油门加速;DeepSeek干的事,是在一片还没铺好的路面上,硬生生造出一条高速公路,然后再在上面跑车。
这不是简单的版本迭代,而是连算力底座一起换了。
英伟达的CUDA生态有十几年积累,算子覆盖、内存管理、通信调度都极其成熟。而昇腾的CANN框架在这些方面仍有差距。这意味着DeepSeek工程团队需要在大量底层细节上进行针对性优化,甚至手动重写关键算子。
一个算子的性能下降,可能影响整条计算链路。这不是修bug,是重建地基。
2026年3月底,DeepSeek经历了成立以来最长的一次服务中断——长达12小时。多名供应商分析,这是V4在进行C端”隐身测试”,冲击更高性能架构时,新旧架构在底层存储聚合层出现了冲突。
与其说是一次模型延迟,不如说是中国顶尖算法团队与国产芯片体系之间的一次深度磨合。
这不是掉队,是默默修路。

三、沉默中的爆发:三篇论文,一次底层革新
V4延迟的几个月里,DeepSeek并没有闲着。
2026年1月,梁文锋亲自署名发表论文,提出Engram条件记忆架构,通过哈希查找替代传统神经网络计算,部署成本有望直降90%。2月,上下文窗口从128K扩展至100万Tokens。同月,DeepSeek-OCR 2发布,采用创新的DeepEncoder V2方法,让AI像人类一样按逻辑顺序”看”图像——不再机械地从左上角扫描到右下角,而是基于语义理解驱动视线流动。
3月,网页端悄然上线了”快速模式”和”专家模式”两种交互方式。业内猜测,这是V4在做隐身测试。
这家公司,在所有人以为它”泯然众人”的时候,完成了一次底层架构级的全面革新。

四、V4来了:这条路修通了 
“2026年4月24日,DeepSeek V4-Pro和V4-Flash正式发布并开源。
模型上下文处理长度扩展至1M,首次增加KV Cache滑窗和压缩算法,大幅减少Attention计算和访存开销,并通过模型架构创新更好地支持了Agent和Coding场景。

本地芯片+本地模型,用国产的卡训练的。

既不至于哪天老美真把卡收紧了,再临时适配国内资源;同时也是为了从最底层,推动国产大模型持续进步,甚至领先。

HW计算官方确认:昇腾超节点全系列产品支持DeepSeek V4系列模型。昇腾950通过融合kernel和多流并行技术,实现了V4-Pro模型20ms、V4-Flash模型10ms的低时延推理。
寒W纪也在发布首日完成了”Day 0″适配,适配代码同步开源。
这一天,中国AI产业在摆脱对国外技术生态依赖、推进”去CUDA化”进程中,迈出了重要一步。
回头看,V4的这次”迟到”,恰恰印证了这家公司最根本的底色:
「不诱于誉,不恐于诽,率道而行,端然正己。」
不是为了暂时的领先,而是愿意为了长期的正确,承受短期的不被理解。  
从量化的毫秒,到AI的漫长迭代,再到芯片底座的底层重构——DeepSeek用近乎”笨拙”的方式证明了一件事:真正改变世界的技术,从来不是赶出来的。
本文涉及的任何内容及观点仅供参考,不构成投资建议或依据,投资需自主决策、自行承担风险。投资有风险,入市需谨慎!