黄仁勋:不卖AI芯片给中国,是把市场拱手送给华为
关注并星标哔哔News
带你看不一样的区块链资讯!

本文所表达的任何观点仅代表作者个人立场,不应作为投资决策依据,也不构成任何投资建议。请读者严格遵守当地法律法规。
4月15日,黄仁勋在Dwarkesh Patel的播客中,给出了非常明确的判断:限制对中国出口 AI 芯片,并不会阻止中国发展 AI,反而是在把市场和开发者生态拱手送给华为。
在他看来,真正的竞争不在有没有芯片,而在于全球 AI 是建立在哪一套技术栈之上。
几天前,Anthropic 披露了一个内部叫 Mythos 的模型:它扫遍了几乎所有主流操作系统和浏览器,甚至找到了 OpenBSD中存在 27 年的零日漏洞。出于安全考虑,这个模型暂不对外公开,而是先给美国企业留出一段时间修补漏洞。
于是出现了一个具体的问题:如果中国也获得足够的算力,是否会更早训练出这样的模型,并在美国准备好之前,就大规模部署具备网络攻击能力的 AI 系统?
围绕这个切口,主持人Dwarkesh Patel在这场对谈中向英伟达 CEO 黄仁勋发起了一场高强度的追问。
Dwarkesh 的逻辑是:美国当前的领先优势正是建立在算力更充足的基础上。向中国出口芯片,本身就在削弱这种先发现、先防御的窗口期。
黄仁勋并不否认竞争的存在,但反复强调:中国并不缺算力,也不会因为限制而停下发展。真正关键的不是有没有芯片,而是整个 AI 体系,能源、算法、架构、开发者生态以及技术栈的归属。
于是,这段对话逐渐从要不要卖芯片,转向更深层的分歧:黄仁勋最担心的结局,不是中国训练出更好的模型,而是失去对全球 AI 标准的定义权。把全球 AI 开发者留在美国的技术生态里,才是真正意义上的赢。
他认为,让全球 AI 开发者都建立在Nvidia 和美国技术栈上,才是美国真正的战略优势。目前中国的开源模型也建立在 CUDA 上,这是好事。出口管制恰恰在把这些开发者推向华为体系,一旦他们的生态转移,影响将是长期且难以逆转的。
Dwarkesh 关注的是时间窗口:在AI 能力即将跃迁的这几年内,哪怕边际上延缓对手,难道不值得?
黄仁勋关注的是另一个维度:为了守住一个可能根本不存在的窗口,放弃整个世界市场,本身才是真正的战略失误。
这段对话并不是在讨论一个简单的政策选择,而是在碰撞两种对 AI 时代的根本判断:AI 究竟更像一种需要严格限制的战略资源,还是一种必须深度参与、否则就会被边缘化的基础设施竞争。
以下是这场对话中关于这一部分的完整内容。

应该向中国出售 AI 芯片吗?
Dwarkesh Patel:好。我想问一下关于中国的问题。其实我自己也不确定,向中国出售芯片这件事到底是好是坏,但我喜欢在访谈中扮演一下唱反调的角色。
所以当 Dario(支持出口管制)来做客时,我问他:为什么美国和中国不能各自都拥有一个天才云集的数据中心?既然你是持相反观点的,那我就从另一个方向来问你。
有一种看法是,Anthropic 前几天发布了 Mythos Preview。这个模型他们甚至没有公开发布,因为他们认为它具备很强的网络攻击能力,在确保这些零日漏洞被修补之前,世界还没有准备好接受它。
他们说,这个模型在几乎所有主流操作系统和浏览器中发现了成千上万个高危漏洞。甚至在 OpenBSD 中发现了一个漏洞,这个系统是专门设计来避免零日漏洞的,而这个漏洞已经存在了 27 年。
所以问题是,如果中国的公司、实验室以及政府能够获得 AI 芯片,去训练类似 Claude Mythos 这种具备网络攻击能力的模型,并且用更大的算力运行数百万个实例,这会不会对美国公司乃至国家安全构成威胁?
Jensen Huang:首先,Mythos 的训练使用的是相当普通的算力规模和类型。它是由一家非常出色的公司完成的,但所用的算力并不特殊,而且在中国是广泛存在的。所以你首先要意识到,中国本来就有芯片。
他们生产了全球 60% 的主流芯片,甚至可能更多。这对他们来说是一个非常庞大的产业。他们拥有世界上一些最顶尖的计算机科学家。正如你所知道的,这些 AI 实验室里有大量研究人员是中国人。
他们拥有全球 50% 的 AI 研究人员。所以问题是,考虑到他们已经拥有的这些资源。他们有充足的能源,有大量芯片,还有绝大多数 AI 研究人员。如果你担心他们,那怎样才能创造一个更安全的世界?
把他们当成受害者、把他们推向对立面,可能并不是最好的答案。他们确实是竞争对手。我们希望美国获胜。但我认为,对话以及科研层面的交流,可能才是最安全的路径。现在这一点恰恰是严重缺失的,因为我们把中国视为对手的态度。
让我们的 AI 研究人员和他们的研究人员进行交流是非常必要的。我们也需要共同达成一些共识,比如 AI 不应该被用来做什么。
至于发现软件漏洞,这本来就是 AI 应该做的事情。它会发现很多漏洞吗?当然会。软件里本来就有很多漏洞,AI 软件本身也有。这正是 AI 的价值所在。我很高兴 AI 已经发展到可以显著提升我们生产力的阶段。
有一点被低估了,就是围绕网络安全、AI 安全、隐私和安全性的整个生态系统的丰富程度。现在有一整套 AI 初创公司在构建这样一个未来:一个强大的 AI 代理周围,会有成千上万个 AI 代理去监控它、保护它、确保它的安全。
那种让一个 AI 自由运行、却没有任何监督的想法,其实是很荒谬的。我们非常清楚,这个生态系统必须发展壮大。而这个生态系统需要开源,需要开放模型,需要开放技术栈,这样所有 AI 研究人员和计算机科学家才能构建足够强大、同时又能确保安全的 AI 系统。
所以我们必须确保开源生态保持活力,这一点不能被忽视。而其中很大一部分创新正来自中国,我们不应该去扼杀它。
关于中国,当然我们希望美国拥有尽可能多的算力。我们目前受限于能源,但有很多人在解决这个问题。我们不能让能源成为国家发展的瓶颈。同时,我们也希望全球所有 AI 开发者都基于美国的技术栈进行开发,把 AI 的进步,尤其是开源部分,贡献到美国的生态系统中。
如果最终形成两个体系:一个开源生态运行在外国技术栈上,而美国这边是一个封闭生态,那将是对美国非常糟糕的结果。
Dwarkesh Patel:你提到了很多点,我稍微整理一下。我认为一个核心担忧还是算力差距的问题。确实,中国有算力,但有一些估算认为,由于他们停留在 7nm 工艺节点,而且因为出口管制拿不到 EUV 光刻机,他们实际能提供的算力(flops)大概只有美国的十分之一。
在这种情况下,他们最终也许能训练出像 Mythos 这样的模型。但问题是,因为美国有更多算力,美国的实验室可以更早达到这种能力水平。
比如 Anthropic 先做出来之后,他们可以先内部保留一个月,把模型提供给美国公司,让他们修补漏洞,然后再公开发布。
此外,即使他们能训练出类似模型,规模化部署能力也很关键。如果一个网络攻击者拥有一百万个AI 实例,而不是一千个,那危险程度完全不同。所以推理算力同样非常重要。
而且正因为中国有那么多优秀的 AI 研究人员,这反而更令人担心。因为提升这些研究人员效率的关键,就是算力。你去问任何一家美国 AI 实验室,他们都会说,最大的瓶颈就是算力。DeepSeek 或 Qwen 的负责人也说过,他们的瓶颈就是算力。
所以问题是,是不是更好的策略是让美国公司凭借更多算力先达到这些能力水平,提前让社会做好准备,而中国因为算力较少,会稍晚一些达到?
Jensen Huang:我们当然应该始终领先,并且拥有更多。但如果你想让你刚才描述的那种情况成立,就必须假设一个极端前提:他们完全没有算力。
但现实不是这样。只要他们有一定算力,问题就变成:需要多少算力才够?
而中国已经拥有的算力是非常巨大的。你说的是世界第二大计算市场。如果他们愿意整合资源,他们完全有能力聚集足够的算力。
Dwarkesh Patel:但这是真的吗?有人做过估算,说 SMIC 在制程上是落后的。
Jensen Huang:我正要说这个。
Dwarkesh Patel:好。
Jensen Huang:他们拥有的能源是极其丰富的,对吧?AI 本质上是一个并行计算问题,对吧?那为什么他们不能简单地用更多芯片,比如 4 倍、10 倍数量的芯片堆叠在一起?因为他们的能源非常便宜、非常充足。
他们有大量已经建好的数据中心,甚至是空置的、已经通电的。你知道他们有鬼城,他们也有鬼数据中心。他们有巨大的基础设施冗余。如果他们愿意,即便使用 7nm 芯片,也可以通过堆叠更多芯片来实现目标。
他们的芯片制造能力是世界上最大的之一。整个半导体行业都知道,他们在主流芯片领域占据主导地位。他们甚至是产能过剩的,有太多产能。所以说,“中国拿不到 AI 芯片”这种说法是完全站不住脚的。
当然,如果你问我,美国是不是在全球其他国家完全没有算力的情况下会更领先?那当然。但这不是现实情况。他们已经拥有足够的算力,甚至已经超过了你所担心的那个阈值。
你需要理解,AI 是一个五层蛋糕,最底层是能源。如果能源充足,可以弥补芯片不足;如果芯片充足,可以弥补能源不足。
比如美国现在的瓶颈是能源,这也是为什么 Nvidia 必须不断提升架构效率,通过极致的软硬件协同设计,让有限的芯片在有限能源下实现极高的性能功耗比。
但如果你的能源几乎无限、接近免费,那你还在乎性能功耗比吗?你可以用更多、甚至更旧的芯片来完成任务。所以 7nm 芯片其实已经足够用了,基本相当于 Hopper 这一代。事实上,现在很多模型就是用 Hopper 训练的。所以 7nm 完全够用。而他们的优势在于能源充足。
Dwarkesh Patel:但还有一个问题,他们是否能制造足够多的芯片?
Jensen Huang:他们已经在做了。证据是什么?华为刚刚经历了公司历史上规模最大的一年。
Dwarkesh Patel:他们出货了多少芯片?
Jensen Huang:很多。数百万级。数百万已经远远超过 Anthropic 所拥有的数量。
Dwarkesh Patel:这里有一个问题,就是中芯国际(SMIC)到底能生产多少逻辑芯片,以及他们能生产多少内存……?
Jensen Huang:我直接告诉你现实情况。他们有充足的逻辑芯片,也有充足的 HBM2 内存。
Dwarkesh Patel:对。但你也知道,在训练和推理这些模型时,瓶颈往往是带宽。如果是 HBM2……我现在没有具体数字,但和你们最新一代产品相比,内存带宽可能差接近一个数量级,这差距是非常大的。
Jensen Huang:华为本身就是一家网络公司。
Dwarkesh Patel:但这并不能改变一个事实:最先进的 HBM 还是需要 EUV(极紫外光刻机)。
Jensen Huang:不对,完全不对。你可以把它们拼接在一起,就像我们用 NVL72 那样。他们已经展示了硅光子技术,可以把所有这些算力连接成一个巨大的超级计算机。你的前提本身就是错误的。
事实是,他们的 AI 发展进展良好。世界上最优秀的 AI 研究人员,因为算力受限,反而会提出极其聪明的算法。记住,我刚刚说过,摩尔定律每年大约提升 25%。但通过优秀的计算机科学,我们仍然可以把算法性能提升 10 倍。我想表达的是,真正的杠杆在于优秀的计算机科学。
毫无疑问,MoE(混合专家)是一个伟大的发明。各种注意力机制的改进,也在减少计算需求。我们必须承认,AI 的大部分进步来自算法进步,而不仅仅是硬件性能。
既然大多数进步来自算法、计算机科学和编程,那你能否否认他们庞大的 AI 研究人员队伍才是他们的核心优势?我们已经看到了。
DeepSeek 绝不是一个无足轻重的突破。如果有一天 DeepSeek 这样的模型首先在华为体系上跑出来,那对我们国家来说将是一个非常糟糕的结果。
Dwarkesh Patel:为什么?因为目前像 DeepSeek 这样的模型,如果是开源的,是可以在任何加速器上运行的。为什么未来会改变这一点?
Jensen Huang:假设不会改变。假设它专门为华为优化,针对他们的架构优化,那就会让我们的体系处于劣势。你描述的其实是一个我认为是好消息的情况:一家企业开发了软件、开发了 AI 模型,并且它在美国的技术栈上运行得最好。我认为这是好消息,而你把它当成坏消息来设定。
那我告诉你什么才是真正的坏消息:全球的 AI 模型是在非美国硬件上开发,并且在非美国技术栈上运行得最好。这对我们来说才是坏消息。
Dwarkesh Patel:我只是没有看到证据表明,不同加速器之间存在巨大差异,以至于无法切换。美国的实验室会在各种云平台、各种加速器上运行他们的模型……
Jensen Huang:我本身就是证据。你拿一个为 Nvidia 优化的模型,试着在其他平台上跑。
Dwarkesh Patel:但美国实验室确实在这么做。
Jensen Huang:但它们运行得不会更好。Nvidia 的成功本身就是最好的证据。AI模型是在我们的技术栈上创建,并且在我们的技术栈上运行得最好,这有什么难理解的吗?
Dwarkesh Patel:Anthropic 的模型既在 GPU 上运行,也在Trainium 上运行,也在 TPU 上运行。
Jensen Huang:要做这些迁移,需要大量工作。但你去看看全球南方国家,看看中东。如果所有 AI 模型一开始就在别人的技术栈上运行得最好,那你现在是在提出一个相当荒谬的论点,认为这对美国是好事。
Dwarkesh Patel:但我还是不太理解你的论点。假设中国公司先做出了下一个 Mythos。他们先发现了美国软件中的所有安全漏洞,但他们是用 Nvidia 硬件完成的,并且把它推广到全球南方。他们用的是 Nvidia 硬件。这有什么好处?即便它运行在 Nvidia 上……
Jensen Huang:这并不好。这并不好。
Dwarkesh Patel:对。
Jensen Huang:这不好。所以我们就不要让它发生。
Dwarkesh Patel:那为什么你认为,如果不向他们提供算力,这些算力就会被华为完全替代?他们确实是落后的,对吧?他们的芯片不如你们先进。
Jensen Huang:这完全……现在就有证据。他们的芯片产业非常庞大。
Dwarkesh Patel:你可以直接比较 H200 和华为 910C 的算力、带宽、内存,大概只有一半到三分之一。
Jensen Huang:那他们就用更多的数量。他们用两倍的芯片。
Dwarkesh Patel:听起来你的意思是,他们有大量现成的能源,对吧?然后他们需要用芯片把这些能源填满。
Jensen Huang:而且他们也很擅长制造。
Dwarkesh Patel:我也相信最终他们可能会在制造能力上超过所有人。但关键是在接下来的这几年。
Jensen Huang:你说的关键几年是指什么?
Dwarkesh Patel:就是接下来的几年。我们将拥有这些能够执行各种网络攻击的模型。
Jensen Huang:如果接下来的几年真的这么关键,那我们就必须确保,在这段关键时期,全球所有 AI 模型都建立在美国的技术栈之上。
Dwarkesh Patel:即便它们建立在美国技术栈上,如果它们具备更先进的能力,这又如何阻止它们发起类似 Mythos 的网络攻击?
Jensen Huang:无论哪种情况,都没有绝对保证。
Dwarkesh Patel:但如果我们更早拥有它,我们就可以提前做好准备。
Jensen Huang:听着,为什么你要让 AI 产业中的一个层级失去整个市场,只是为了让另一个层级受益?AI 是一个五层结构,每一层都必须成功。而最需要成功的其实是 AI 应用层。你为什么如此执着于那个 AI 模型?那一家公司?为什么?
Dwarkesh Patel:因为这些模型使得那些极具攻击性的能力成为可能,而运行它们需要算力。
Jensen Huang:能源、芯片,以及 AI 研究人员的生态,共同决定了这些能力。
Dwarkesh Patel:好,退一步说,前提必须是中国能够建立足够的 7nm 产能。而且要记住,他们现在还停留在 7nm,而你们会推进到 3nm、2nm,甚至 Feynman 架构下的 1.6nm。
所以当你们到 1.6nm 时,他们仍然在 7nm。他们必须生产足够多的芯片来弥补差距。他们有大量能源,因此你给他们越多芯片,他们的算力就越多。所以最终问题还是,他们获得更多算力,而算力是训练和推理的输入……
Jensen Huang:听着,我认为你在用一种绝对化的方式思考问题。我认为美国应该领先。美国的算力规模是世界其他任何地方的 100 倍。美国应该领先。现在,美国确实领先。
Nvidia 在构建最先进的技术。我们确保美国实验室是最先了解到这些技术、也是最先有机会购买的。如果他们资金不足,我们甚至会投资他们。美国必须领先。我们正在尽一切努力确保美国领先。
这是第一点。你同意吗?我们正在尽一切努力做到这一点。
Dwarkesh Patel:但如果中国的瓶颈是算力,那向中国出口芯片,怎么会让美国保持领先?
Jensen Huang:不,不。我们为美国准备了 Vera Rubin,我们为美国准备了 Vera Rubin。那我是在美国,对吧?你认为我是美国的一部分吗?
Dwarkesh Patel:是的。
Jensen Huang:Nvidia。你认为 Nvidia 是一家美国公司吗?好。第一点,为什么我们不制定一种更平衡的监管政策,让 Nvidia 能在全球取胜,而不是把整个世界市场拱手让人?为什么你会希望美国放弃全球市场?
芯片产业是美国生态的一部分,是美国技术领导力的一部分,也是 AI 生态的一部分,是 AI 领导力的一部分。为什么你的政策、你的理念,会导向让美国放弃全球如此大的一块市场?
Dwarkesh Patel:我理解你的意思是……Dario 有一句话,他说这就像波音在炫耀,“我们在向朝鲜卖核武,但导弹外壳是波音制造的”,然后说这 somehow 是在强化美国技术栈。从根本上说,你是在给他们提供这种能力。
Jensen Huang:把 AI 和你刚才提到的那些东西相提并论,是荒谬的。
Dwarkesh Patel:但 AI 有点像浓缩铀,对吧?它既可以有正面用途,也可以有负面用途。我们同样不希望把浓缩铀送到其他国家。
Jensen Huang:谁在发送浓缩……
Dwarkesh Patel:这个类比是说,浓缩铀就像算力。
Jensen Huang:这是一个很糟糕的类比,是一个不合逻辑的类比。
Dwarkesh Patel:但如果这些算力可以运行一个模型,而这个模型能够对所有美国软件发起零日攻击,那它怎么不算是一种武器?
Jensen Huang:首先,解决这个问题的方法,是和研究人员对话,与中国对话,与所有国家对话,确保人们不会那样使用技术。这种对话是必须发生的。这是第一点。
第二点,我们也需要确保美国保持领先,让 Vera Rubin、Blackwell 这样的系统在美国大量可用,大规模部署。我们的成果已经说明了这一点:我们有充足的算力,非常多的算力。我们这里有优秀的 AI 研究人员。这很好。我们应该继续保持领先。
但同时,我们也必须认识到,AI 不只是一个模型。AI 是一个五层蛋糕。AI 产业在每一层都很重要,我们希望美国在每一层都赢,包括芯片这一层。如果把整个市场拱手让出,美国在芯片层、在计算技术栈上的长期竞争中,是不可能赢的。这是一个事实。
Dwarkesh Patel:那问题的核心似乎变成了:现在向他们出售芯片,如何帮助我们在长期中取胜?特斯拉曾经在中国卖了很多非常优秀的电动车,iPhone 也在中国卖得很好,但这并没有形成锁定效应。中国还是做出了自己的电动车,并且现在占据主导地位,他们的智能手机也占据主导。
Jensen Huang:我们今天一开始对话时,你就承认 Nvidia 的地位是不同的。你用了“护城河”这样的词。对我们公司来说,最重要的就是生态系统的丰富性,而这取决于开发者。全球 50% 的 AI 开发者在中国。美国不应该放弃这一点。
Dwarkesh Patel:但美国也有很多 Nvidia 开发者,这并不妨碍美国实验室未来使用其他加速器。事实上他们现在也在用,这没有问题,也很好。我不明白为什么在中国,如果你卖给他们 Nvidia 芯片,就不会出现同样的情况。就像 Google 既可以用 TPU,也可以用 Nvidia 一样……
Jensen Huang:我们必须持续创新。而且你也应该知道,我们的市场份额是在增长,而不是下降。你这个前提,即便我们参与中国市场,最终也会失去这个市场。你不是在跟一个天生失败者说话。这种失败者心态,这种失败者前提,对我来说毫无意义。
我们不是汽车。不是说我今天开这个品牌,明天换另一个品牌,很容易。计算不是这样的。这也是为什么 x86 能长期存在,为什么 ARM 具有高度黏性。这些生态系统是很难替代的。替代它们需要巨大的时间和精力,而大多数人不愿意这么做。
所以我们的工作是不断培育这个生态,不断推进技术,这样我们才能在市场中竞争。
基于你所描述的前提去主动放弃一个市场,我无法接受。这毫无意义。因为我不认为美国是失败者。我们的产业不是失败者。这种失败逻辑、失败思维,对我来说没有意义。
Dwarkesh Patel:好吧,我继续往下问。我只是想确认……
Jensen Huang:你不用换话题,我挺享受这个讨论的。
Dwarkesh Patel:好,那我就继续。我也很感谢你这样来回讨论,因为我觉得这样能更清楚地暴露问题的核心。
Jensen Huang:核心在于,你的论证是从极端出发的。你的逻辑是:如果在这个关键时刻给他们任何算力,我们就会失去一切。
Dwarkesh Patel:不是,我的意思其实是……
Jensen Huang:这种极端,是很幼稚的。
Dwarkesh Patel:让我自己把我的论点说完整。重点不是某个关键算力阈值,而是边际算力都是有用的。算力越多,就能训练出更好的模型。
Jensen Huang:那我也希望你承认,对于美国科技产业来说,每一笔额外的销售都是有益的。
Dwarkesh Patel:其实我不太认同。如果这些芯片上运行的 AI 模型具备网络攻击能力,或者这些芯片被用来训练这样的模型并大规模运行,那它虽然不是核武器,但它确实在赋能一种武器。
Jensen Huang:按照你的逻辑,你也可以把同样的话用在微处理器、DRAM 上,甚至可以用在电力上。
Dwarkesh Patel:但事实上,我们确实对一些关键技术实施了出口管制,比如先进 DRAM 的制造技术,还有很多芯片制造相关技术。
Jensen Huang:但我们依然向中国出售大量 DRAM 和 CPU,而且我认为这是正确的。
Dwarkesh Patel:那问题就回到了最根本的地方:AI 是否是不同的?如果存在一种技术,可以发现软件中的零日漏洞,那我们是否应该尽量限制中国更早获得这种能力、并大规模部署它?
Jensen Huang:我们希望美国保持领先。而这一点是我们可以控制的。
Dwarkesh Patel:如果芯片已经在那里,而且他们正在用这些芯片训练模型,那我们怎么控制?
Jensen Huang:我们有大量算力。我们有大量 AI 研究人员。我们正在以最快速度推进。
Dwarkesh Patel:再举个例子,我们的核武器比任何国家都多,但我们仍然不会把浓缩铀输出给别人。
Jensen Huang:我们不是浓缩铀。这是芯片,而且是他们自己也能制造的芯片。
Dwarkesh Patel:但他们之所以从你这里买,是因为你的芯片更好。我们有中国公司创始人的表态,说他们的瓶颈就是算力。
Jensen Huang:因为我们的芯片更好。从整体上看,我们的芯片就是更好,这一点毫无疑问。但即便没有我们的芯片……你能承认华为刚刚创下了历史最佳业绩吗?你能承认有很多芯片公司成功上市了吗?你能承认吗?
Dwarkesh Patel:可以。
Jensen Huang:你也能承认,我们曾经在那个市场占有很大份额,而现在已经不再拥有这么大的份额?同时你也能承认,中国大约占全球科技产业的 40%。
如果美国科技产业主动放弃这个市场,那是对国家的不负责任,是对国家安全的不负责任,是对技术领导力的不负责任,而这一切只是为了让某一家公司受益。这对我来说毫无意义。
Dwarkesh Patel:我有点困惑。感觉你在说两件不同的事情。一方面你说,如果允许竞争,我们会用更先进的芯片战胜华为;另一方面你又说,即使没有我们,他们也会做同样的事情。这两点怎么能同时成立?
Jensen Huang:这显然是成立的。如果没有更好的选择,你就会使用你唯一的选择。这有什么不合逻辑的?这是非常合逻辑的。
Dwarkesh Patel:他们想要 Nvidia 芯片,是因为它更好。
Jensen Huang:是的。
Dwarkesh Patel:更好意味着更多算力,而更多算力意味着可以训练更好的模型。
Jensen Huang:不只是算力更好,而是整体更好。更容易编程,我们有更好的生态。但不管更好具体指什么……当然我们会向他们提供算力,那又怎样?关键是,我们从中获得了好处。
不要忘记,我们获得的是美国技术领导力的收益,我们获得的是开发者在美国技术栈上工作的收益。
当这些 AI 模型向全球扩散时,美国技术栈也会随之成为最优选择。我们可以持续推进并扩散美国技术。这在我看来是积极的,是美国技术领导力的重要组成部分。
而你所主张的这些政策,曾经让美国通信产业基本被政策驱逐出全球市场,以至于我们现在甚至无法掌控自己的通信体系。我不认为这是明智的。这是一种有些狭隘的思维,而且带来了意想不到的后果,这些后果我现在正在向你解释,但你似乎很难理解。
Dwarkesh Patel:好,我们稍微退一步。现在看起来核心问题在于:这里既有潜在收益,也有潜在成本。我们要弄清楚的是,这个收益是否值得这个成本。我想做的是让你承认这个潜在的成本。
算力是训练强大模型的输入,而强大的模型确实具备强大的攻击能力,比如网络攻击。美国公司先达到 Mythos 级别的能力,这是件好事,然后他们暂时不公开这些能力,让美国公司和政府有时间去加固软件安全,在这种能力被公布之前做好防护。
如果中国拥有更多算力,或者更多可调度的算力,如果他们能更早做出 Mythos 级别的模型并大规模部署,那将是非常糟糕的结果。而之所以没有发生,其中一个原因是,美国通过像 Nvidia 这样的公司,拥有更多算力。
把芯片卖给中国,这就是其中的一个成本。先不谈收益,你是否承认这是一个潜在成本?
Jensen Huang:我也可以告诉你另一个潜在成本:我们让 AI 技术栈中最关键的一层之一,芯片层,放弃整个市场,也就是世界第二大市场。这样他们就能建立规模,建立自己的生态系统,让未来的 AI 模型以一种与美国技术栈完全不同的方式进行优化。
当 AI 向全球扩散时,他们的标准、他们的技术栈会变得比我们的更有优势,因为他们的模型是开源的。
Dwarkesh Patel:我大概是比较相信 Nvidia 的内核工程师和 CUDA 工程师,我觉得他们可以完成优化……
Jensen Huang:AI 不只是内核优化,这一点你是知道的。
Dwarkesh Patel:当然,但还有很多手段,比如蒸馏,让模型更适配你的芯片。
Jensen Huang:我们会尽全力去做。
Dwarkesh Patel:你们掌握所有软件,很难想象即便他们一段时间内有更好的开源模型,也会形成对中国生态的长期锁定。
Jensen Huang:中国是全球开源软件最大的贡献者,这是事实。中国也是全球开源模型最大的贡献者,这是事实。而今天,这些都建立在美国技术栈上,建立在 Nvidia 之上,这也是事实。
AI 技术栈的五个层级都很重要。美国应该在这五个层级全部取胜,它们都很关键。其中最重要的当然是 AI 应用层,真正扩散到社会中、被最广泛使用的那一层,将从这场工业革命中获得最大收益。但我的重点是,每一层都必须成功。
如果我们把整个国家吓到,认为 AI 就像核弹一样,让所有人都厌恶 AI、害怕 AI,我不明白这对美国有什么帮助。这是在伤害美国。
如果我们把所有人都吓得不愿意做软件工程师,因为 AI 会消灭所有软件工程岗位,结果我们真的没有软件工程师了,那是在伤害美国。
如果我们把所有人都吓得不去学放射学,因为计算机视觉是免费的,而且 AI 不会比放射科医生做得更差,那我们就是误解了工作和任务的区别。放射科医生的工作是病人护理,而读片只是其中的一个任务。
如果我们严重误解这一点,把人都吓跑了,那我们将没有足够的放射科医生,也不会有足够好的医疗体系。
所以我想表达的是,当你用一种非常极端的前提去思考问题,把一切都推向0 或无穷,我们最终会以一种并不真实的方式吓到人。现实不是这样的。
我们希望美国第一吗?当然。我们需要在这个技术栈的每一层都成为领导者吗?当然需要。你今天谈 Mythos,因为它很重要,这没问题。
但几年之后,我可以给你一个预测:当我们希望美国技术栈、美国技术向全球扩散,扩展到印度、中东、非洲、东南亚。当我们的国家希望输出技术、输出标准的时候,我希望你我再来进行同样的对话。
到那时,我会告诉你,今天这场讨论,你的政策、你的设想,是如何让美国在没有任何充分理由的情况下,把全球第二大市场拱手让出。
我们不应该主动放弃这个市场。如果我们竞争失败,那是另一回事。但为什么要主动放弃?
没有人主张全有或全无。没有人主张在任何时候都向中国出售一切技术。没有人这么说。我们应该始终把最先进的技术留在美国,本土拥有最多、最优、最先的技术。但同时,我们也应该在全球范围内竞争并取胜。这两件事可以同时成立。
这需要一些细腻的判断,需要一些成熟度,而不是绝对化的思维。世界本来就不是非黑即白的。
Dwarkesh Patel:那这个论点的关键在于:他们在未来几年基于自己最好的芯片开发模型,这些芯片再出口到全球,从而建立标准。由于EUV 出口限制,你们会发展到 1.6nm,而他们几年后可能仍在 7nm。
在国内,他们可能会说:“我们能源充足,可以规模化生产,继续用 7nm。”但在出口层面,他们的 7nm芯片必须能和你们的 1.6nm 芯片竞争。他们的模型必须被优化到一个程度,使得在 7nm 上运行,比在你们的 1.6nm 上运行更优。
Jensen Huang:那我们就回到事实本身。Blackwell 的光刻先进程度是Hopper 的 50 倍吗?是 50 倍吗?完全不是。我已经反复说过了,摩尔定律已经放缓甚至失效了。
从 Hopper 到Blackwell,单纯从晶体管层面看,大概提升 75%。它们相隔三年,大约 75%。但 Blackwell 的整体性能是 Hopper 的 50 倍。
我的意思是,架构很重要。计算机科学很重要。半导体物理当然也重要,但计算机科学同样重要。
AI 的影响力,很大程度来自计算栈本身。这也是为什么 CUDA 如此有效、如此受欢迎。它是一个生态系统,是一种计算架构,提供了极大的灵活性。如果你想完全改变架构,比如做 MoE、做扩散模型、做解耦架构,你都可以实现,而且实现起来并不困难。
所以现实是,AI 同样依赖上层技术栈,而不仅仅是底层硬件架构。只要我们在架构和软件栈上针对自身生态进行了优化,这显然是好事,因为我们一开始就讨论过,Nvidia 的生态非常丰富。
为什么大家总是优先用 CUDA 编程?确实如此,中国的研究人员也是这样。
但如果我们被迫退出中国市场,首先,这是一个政策错误。显然会带来反作用。事实上,它已经对美国产生了不良后果。它促使并加速了中国的芯片产业发展,迫使他们整个 AI 生态转向内部架构。这件事还没有完全不可逆,但已经发生了。
你会看到,未来他们显然不会停留在 7nm。他们在制造方面很强,会继续从 7nm 向更先进节点推进。现在,5nm 和 7nm 之间有 10 倍差距吗?答案是否定的。
架构很重要,网络也很重要。这也是为什么 Nvidia 收购了 Mellanox。网络很重要,能源也很重要。这些因素都很关键。事情并不像你试图简化的那样。

给我点一个推荐💖吧!

评论