GPT-5.6泄露是意外还是营销?150万token上下文背后,OpenAI到底在赌什么
GPT-5.6泄露是意外还是营销?150万token上下文背后,OpenAI到底在赌什么

5月底,开发者Haider在审查OpenAI Codex路由日志时,在大量GPT-5.5调用记录中发现了一条指向gpt-5.6的调用条目。这条记录很快消失了——像是被人删掉了一样。但截图已经传遍了整个AI社区。随后多名开发者通过ChatGPT Pro的OAuth认证,在Codex环境中成功调用了这个未发布的模型。
于是,GPT-5.6的”泄露”成了2026年6月AI圈最大的谈资。但一个有意思的争议始终存在:这到底是意外泄露,还是OpenAI精心设计的营销事件?
正方:这肯定是意外
支持”意外论”的证据有几个。第一,最初的gpt-5.6调用条目确实很快消失了,如果是刻意营销,为什么删掉?第二,多名开发者是通过OAuth认证的正式接口调用的,这说明模型确实在后台跑着,不是空壳。第三,OpenAI一贯的风格是”先做再说”,Sam Altman虽然爱发推特,但产品泄露不是他的惯用手法。
反方:这太像营销了
怀疑”营销论”的理由也够充分。第一,150万token上下文窗口——这个参数恰好比GPT-5.5的105万token高出43%,不多不少,刚好够形成”跨越式升级”的叙事。第二,泄露时间点太精准:GPT-5.5发布才三周,Nemotron 3 Ultra刚在Computex上大出风头,Claude Sonnet 4.8也在Vertex AI后端现身。6月是大模型集中发布的月份,OpenAI需要一个话题来维持热度。第三,”开发者意外发现”这种叙事本身就很适合社交媒体传播——它满足了”圈内人先知道”的优越感,传播效率比官方公告高十倍。
我个人的判断:两者都有。最初的日志暴露可能是真意外,但OpenAI发现后没有急着封堵,反而让更多开发者通过OAuth成功调用——这至少是”不作为的默许”。在营销学上这叫”controlled leak”,不算罕见。
150万token上下文意味着什么?
抛开泄露的真假不谈,150万token上下文这个参数本身就值得深挖。
150万token约等于750万汉字,或约375万英文单词。这个容量意味着你可以把一整个代码库、一整本技术手册、或者一整年的对话记录一次性喂给模型,让它在不丢失上下文的情况下进行理解和推理。
对开发者来说,这意味着代码审查可以做到”全项目级别”——不是一个个文件地看,而是把整个仓库扔进去让模型找出跨文件的bug和优化点。对企业来说,这意味着知识库查询可以做到”全量级”——不再需要先检索再总结,直接让模型读完所有文档再回答。
但150万token的上下文也有明显的挑战。首先是计算成本:注意力机制的复杂度是O(n²),即使有优化(比如GPT可能也在用Mamba混合架构或某种稀疏注意力),处理150万token的推理成本仍然是巨大的。其次是有效性的问题:上下文窗口大不等于真的能”记住”所有内容——在中段信息上的遗忘问题是当前长上下文模型普遍的短板。
三个代号:iris、ember、beacon
泄露中还出现了三个内部代号:iris-alpha(鸢尾花)、ember-alpha(余烬)、beacon-alpha(灯塔)。这三个代号可能对应三种不同的模型配置或用途。
我的推测是:iris是标准版(主打多步骤推理),ember可能是优化推理速度的版本,beacon可能是长上下文专用版本。但这也只是猜测。有趣的是,”alpha”后缀说明这些模型还在早期测试阶段,距离正式发布可能还有几周。
6月大模型混战:谁在抢什么?
GPT-5.6只是6月大模型混战的一部分。同期还有:
Anthropic的Claude Sonnet 4.8(代号”Conway”):已在Vertex AI后端列出现身,主打持久化后台代理,适配企业级超长任务。这意味着Anthropic在押注”AI Agent作为长期工作伙伴”的场景。
Google的Gemini 3.5 Pro:传闻定档6月,目标在多模态领域提升竞争力。Google在多模态上的积累是最深的,Gemini 3.5 Pro如果能大幅提升视频理解和生成能力,会在特定场景中建立壁垒。
马斯克旗下Grok 5:也在筹备6月发布。xAI的差异化路线是”最大程度的言论自由”和”实时信息接入”(通过X平台),在技术上的竞争力目前不如前三家。
真正的赌注:Agent工作流
GPT-5.6泄露中最值得关注的不是150万token上下文,而是泄露中提到的”Pro版重点强化智能体工作流”。OpenAI想要打造的不是一个更好的聊天机器人,而是一个”可接管用户全数字化生存空间的超级智能体”。
这才是6月大模型混战的真正焦点。上下文窗口是能力指标,Agent工作流是应用场景。谁能做出真正好用的Agent——不是那种半分钟就出错的demo,而是能稳定运行数小时完成复杂任务的”数字员工”——谁就赢得了下一个十年的入场券。
NVIDIA用Nemotron 3 Ultra的91%智能体任务完成率证明了硬件+模型协同的路线,OpenAI用GPT-5.6的150万token上下文赌的是”记忆即能力”的路线,Anthropic用Claude Sonnet 4.8的持久化代理押注”稳定即竞争力”的路线。三条路,一个终点:让AI真正能干活。
至于泄露是不是营销,说实话不重要。重要的是,6月的AI战场已经硝烟弥漫,而消费者和企业用户终于可以看到真正的选择——不再是一家独大,而是多强争锋。这对整个行业来说,是好事。
数据来源:新智元/腾讯新闻GPT-5.6泄露报道(2026年5月25日);IT之家GPT-5.6报道(2026年5月26日);Chinaz站长之家(2026年5月)