显卡市场的冷热不均:一面是游戏市场收缩,一面是AI下放需要铺路


显卡市场的冷热不均:一面是游戏市场收缩,一面是AI下放需要铺路

最近显卡圈有个消息传得挺热闹——RTX 50 Super疑似被重新端上桌了。

最早放出风声的是圈内知名爆料人MEGAsizeGPU,说SUPER系列又“重回正轨”了,计划年内推出。这位老哥之前先爆了50 Super的存在,后来又预告项目黄了,现在又说被重新提上日程了。说实话,看多了也就习惯了。

紧接着,台媒Benchlife也跟进了这则消息,说是明年初CES见。两边的信息拼在一起,这个“复活”的传闻倒是多了几分可信度。

那么,让我把这套新卡的可能规格扒一扒,再把老黄最近的动作串起来看——这次的Super升级,动因可能跟你想的不太一样。

显存:这次最实在的升级

先说规格。综合各方消息来看,RTX 50 Super系列的核心架构变化不大,多数型号的CUDA数量基本没动,唯一例外是RTX 5070 Super的CUDA核心数从6144个小幅增加到6400个

但显存这块,提升挺明显。全系列将换装单颗3GB的GDDR7显存颗粒,取代当前的2GB方案。在不改变位宽的前提下,显存容量普遍增加50%

具体怎么拆?

  • RTX 5060衍生款(可能叫RTX 5060 Super)将从8GB升级至12GB,128-bit位宽配4颗3GB模块达成

  • RTX 5070 Super从12GB跃升至18GB

  • RTX 5070 Ti Super和RTX 5080 Super则直接干到24GB

有意思的是,之前被砍掉的RTX 5060 12GB方案,这次也被捡回来了,大概率会被改名为RTX 5060 Super。看来“废案再利用”这件事,老黄确实玩得挺溜的!

游戏显存焦虑:这刀确实该补了

为什么老黄突然在显存上这么大方?有一个原因很直接:玩家关于显存不够用的吐槽,已经不是一天两天了。

RTX 3060 12GB显存,但性能更强的RTX 3070 Ti只有8GB。RTX 4060 Ti有16GB选项,但RTX 4070却只给了12GB。这种“性能往上走、显存原地踏步”的配置逻辑,这几年一直让玩家很头疼。

老黄有DLSS,有显存压缩技术,他觉得够了。但游戏开发商可不这么想。随着虚幻引擎5普及,贴图精度和模型细节都在往上走,8GB显存吃紧的情况越来越常见。市面上主流3A大作在2K分辨率中高画质下,显存占用经常飙到10GB往上。

玩家这边的显存焦虑,确实不是空穴来风。

比游戏更重要的逻辑:给AI本地化铺路

但如果只看游戏市场,似乎还差点意思。

看一眼NVIDIA最新的财报:游戏业务已经被归到了边缘计算类别,不再是顶梁柱。台北电脑展上老黄的重头戏也不是游戏卡,而是一款叫“RTX Spark”的AI PC芯片

根据官方介绍,RTX Spark是一颗超级芯片,集成了Arm架构CPU和Blackwell GPU,设计目标是让AI代理(如OpenClaw)能在本地安全、高效地运行。ASUS、Dell、HP等厂商都已经宣布会出相关产品

问题在于,RTX Spark的底子决定了它短期内不会便宜。现在的内存和显存价格又处在高位,搭载这颗芯片的PC售价不低,短时间内很难成为主流。

那在RTX Spark普及之前,怎么办?

老黄手里攥着庞大游戏玩家群体,这波人天然是CUDA生态的忠实用户。想要把本地AI能力下放到普通用户手里,最直接的过渡方案就是——先用游戏显卡这块跳板,让更多人接触到本地AI部署的能力

毕竟本地跑AI模型,最大的瓶颈往往不是算力够不够,而是显存装不装得下。

门槛在降低:小模型加速迭代

说到这里,你可能觉得“本地跑大模型”离普通用户还是很远。但其实,端侧小模型的进化速度比想象中快得多。

以Google在2025年底发布的Gemma 3为例,其中4B参数版本的性能据说就能媲美前代27B版本。后者需要高达80GB显存才能部署,而前者只需要约10GB

再看国内的通义千问Qwen 3.5-9B,在INT8量化精度下,显存需求已经降到10GB左右,门槛大幅降低

这意味着什么?过去需要几十GB显存的大服务器才能跑动的任务,现在一张主流游戏显卡就能在家里的电脑上搞定了。

老黄显然看准了这条路。AI模型的本地化部署,需要更多的显存、更强的端侧算力。而英伟达手握CUDA这张最大的底牌,他比谁都清楚——把用户绑在CUDA生态里,比多卖几块游戏卡重要得多。

最后说几句

回过头来看,RTX 50 Super这一轮集体涨显存,表面上是回应玩家对游戏显存容量的诉求,更深一层,其实是老黄在为AI从云端下放到个人桌面铺路。

一个正在发生的趋势是:芯片厂商都在悄悄地给端侧AI搭桥。苹果推统一内存,微软划定40 TOPS的NPU门槛,AMD也拿出了集成大显存的AI MAX系列芯片,老黄则通过显存扩容在游戏端提前布局CUDA生态防线。

至于RTX 60系什么时候来?50 Super真要在明年初发,60系怕是有的等了。不过在那之前,先看看这套Super能不能从传闻变成摆上货架的真东西。毕竟,老黄在画饼这件事上,向来稳得一批。