会空翻的机器人,为什么还要向市场伸手要42亿?

chengsenw 网络营销评论1阅读模式

会空翻的机器人,为什么还要向市场伸手要42亿?

42亿募资,20亿投向"大脑"。

这是宇树科技IPO招股书里最扎眼的一个数字。

一家已经实现规模化盈利的公司,账上躺着20亿现金,还要向资本市场要42亿——不是为了扩产,不是为了卖更多机器人,而是为了补一门之前欠下的课:具身大模型。

王兴兴在招股书里写得很直白:"鉴于全球范围内具身大模型技术均处于研发测试阶段,公司报告期内尚未将自研的通用具身大模型规模化应用于机器人产品。"

翻译一下:我们会跳舞、会空翻、会跑酷,但我们还不会"干活"。

这不是宇树一家的困境,是整个行业的软肋。

就在宇树递交招股书后不久,上海在首届具身智脑技术生态大会上接连落子:启动"人形机器人AI软硬件生态协同系列标准工作"和"全球具身智脑生态共建计划",为具身智能智脑研究院(筹)揭牌。宇树上海、灵境智源、傅利叶智能等10余家头部企业共同签约。

宇树用20亿押注"大脑",上海用生态计划"接单"。这不是巧合,是行业从"硬件竞赛"转向"智能竞赛"的信号。

 什么叫"大脑成了"?三个硬指标 

先厘清一个基础概念:什么是机器人的"大脑",什么是"小脑"?

小脑负责运动控制——关节电机的精准响应、平衡控制算法、多足或双足的协调运动。宇树在春晚舞台上展示的武术、空翻、5米/秒奔跑速度,都是小脑能力的直观体现。

大脑负责认知决策——环境理解、任务规划、自主决策。让机器人听懂"把那个红色的盒子拿给我",然后自己规划路径、避开障碍、完成抓取。

类比一下:小脑是"肌肉记忆",大脑是"思考能力"。

判断大脑是否突破,有三个硬约束指标。

任务成功率——陌生环境下,一次性完成任务的比例。不是实验室里预设好的场景,是真实的工厂车间、家庭环境。

人工干预率——执行过程中需要人为介入的频率。如果每干10分钟就要人救一次场,那这个"大脑"还没到可用的程度。

泛化能力——未训练场景是否可直接执行。今天让它搬红色盒子,明天让它搬蓝色箱子,后天让它拧螺丝,它能不能自己适应。

但行业真正的差距,在量化基准上。

工业可用标准(行业共识区间): 

任务成功率 ≥ 95%人工干预率 ≤ 5%连续运行 ≥ 8 小时无事故

当前水平(多数项目): 

任务成功率 < 70%强依赖人工接管

这不是"再优化一下就好"的差距,是两个数量级的鸿沟。 

宇树在招股书里披露了几个具体的工业场景案例:浙江 500kV 兰亭变电站项目,机器人代替人工执行带电作业;中车株洲工厂项目,执行搬运工作;蔚来汽车项目,执行搬运、组装工作。 

但宇树同时对这些应用的成熟度作出了客观的表述——目前这些工业部署"主要处于验证推广阶段",尚未形成规模化稳定的商业订单。家庭场景则连验证推广都还没到,"主要处于开发训练阶段"。 

小脑决定机器人能"走多稳",大脑决定机器人能"干多少活"。 

 为什么大脑比小脑更重要 

行业共识正在形成:具身智能的终局不是比谁翻跟头漂亮,是比谁能在非标准化环境里稳定干活。

这就是为什么王兴兴在GTC2026发言中指出,行业距离真正跨过"ChatGPT时刻"仍有明显距离。最大的难题在于,还没有出现一个真正具备强泛化能力、能够在陌生场景中稳定执行任务的具身智能模型。

这句话,后来几乎原文进了招股书的风险部分。

一个坦承风险的公司,比只想讲好故事的公司更值得信任。

 20 亿补脑够不够 

宇树本次IPO募资42.02亿元,其中20.22亿元投向"智能机器人模型研发项目",占募资总额的48%。

这个项目的具体内容包括:多模态大模型训练与推理平台、感知与数据采集平台、实时控制与仿真平台、算力租赁费用等。

20亿人民币约2.8亿美元,只是入场券。

特斯拉Optimus的研发投入没有公开披露,但马斯克在2026年财报电话会上提到,Optimus项目累计投入已超过50亿美元。FigureAI在2025年与OpenAI合作后,单轮融资就达到10亿美元,估值390亿美元。

钱不是唯一的约束。宇树在招股书里给出了一个时间表:计划3年内发布"通用人形机器人具身基础模型",该模型将系统性地具备场景泛化、指令泛化、动作泛化与任务泛化四大核心能力。

技术路线上,宇树将以"世界模型-动作"(WMA)具身大模型作为重点研究方向,同时保持对VLA(视觉-语言-动作)技术路线的持续跟进与对标。

 全球玩家各自赌的路径 

把镜头拉远,看看全球玩家的位置。

特斯拉路径是数据飞轮加FSD迁移。但真正的问题是:FSD数据≠具身数据。

FSD是"视觉+路径决策",机器人是"视觉+力反馈+操作结果"。自动驾驶不需要"改变世界",机器人必须"改变世界"(抓、拧、搬)。

特斯拉的优势在"认知决策",但短板在"操作数据",而这恰恰是具身智能最难的部分。

Figure路径是大模型优先加外部能力嫁接。Figure本质是在赌:语言模型的泛化能力,可以直接压缩具身智能的学习成本。2025年与OpenAI合作后,Figure02在宝马工厂的部署进展迅速,但运动控制能力仍在追赶宇树。

波士顿动力是小脑天花板,大脑依赖合作。Atlas电驱版展示的运动能力依然是行业标杆,但商业化落地缓慢。

中国路径是用硬件规模换数据,再用数据反哺大脑。但数据只有在"闭环"里才有价值。

机器人→采集数据→训练模型→提升成功率→带来更多部署。这才叫"飞轮"。否则只是"卖设备+存日志",没有护城河。

还有一个正在变得越来越关键的角色:云厂商和AI基础设施。

国内:阿里云、华为云、百度智能云。国外:NVIDIA、OpenAI。他们在提供训练框架、基础模型、仿真环境。

一个重要趋势:未来"机器人大脑",可能不是每家公司自己训练,而是基于基础模型做微调。

这会引出一个更深的问题:宇树是在"造大脑",还是在"适配大脑"?

小脑全球领先,大脑第一梯队但尚未规模化应用。

 为什么是上海 

宇树选择在上海落子"大脑"研发,不是偶然。

上海在首届具身智脑技术生态大会上启动的"全球具身智脑生态共建计划",试图将分散在芯片、算法、本体制造、场景应用等各环节的力量拧成一股绳。具身智能智脑研究院(筹)的揭牌,则标志着我国具身智能智脑领域从技术研发到产业落地、从单点突破到生态构建的系统性升级。

产业生态完整——长三角供应链、芯片、算法、本体制造、场景应用全链条。根据《上海市具身智能产业发展实施方案》,到2027年,上海将实现核心算法与技术突破不少于20项,集聚百家行业骨干企业,实现百件国际领先产品推广,具身智能核心产业规模突破500亿元。

宇树上海、灵境智源、傅利叶智能、擎朗智能等10余家行业头部企业共同签约,不是简单的"抱团取暖",是在抢"具身智脑中国方案"的定义权。这家研究院将成为"具身智脑中国方案"的技术策源地。

 一个值得警惕的问题 

但一个值得警惕的问题是:如果具身大模型的突破节奏远慢于预期,那么当前的大规模投入,可能会变成一场"算力与资本的消耗战"。

与语言模型不同,具身智能最大的瓶颈不是模型结构,而是数据来源——真实世界交互数据的采集成本,远高于互联网文本数据。这也是为什么"谁先规模化部署机器人,谁就更有可能在大脑竞争中胜出"。

未来3年会发生什么?三分天下。

做平台的(大模型)

——烧钱最猛,不一定最先赚钱。

做整机的(宇树、特斯拉)

——卡在中间,最容易被两头挤压。

做场景方案的(巡检/搬运/安防)

——最早正现金流,但天花板有限。

具身智能的第一波赢家,很可能不是"最聪明的机器人",而是"最能交付的机器人"。

还有一个反直觉的判断:具身大模型,可能不会先在"人形机器人"上成功。

成本太高,自由度太多,控制难度指数级上升。可能路径是:先在固定场景机器人(机械臂/移动底盘)成熟,再迁移到人形。

历史上,每一项改变生产方式的技术,都有一段漫长的"看起来没用"的验证期。

蒸汽机发明后,用了数十年才真正重塑工厂;电气化普及后,劳动生产率的提升并没有立竿见影。人形机器人大概率也会遵循类似的节奏:在相当长的时间里,它们会被用于科研、表演、特殊场景,被笑做"高级玩具";然后,在某个不那么显眼的节点,大脑端的突破会让一切变得不同,商业化的速度会超出所有人的预期。

宇树赌的是:当那个时刻到来,它已经是那个规模最大、成本最低、数据积累最多的玩家。

过去十年,机器人比的是"谁更像人";接下来十年,比的是"谁能替代人"。

2027年,宇树能否发布通用人形机器人具身基础模型,上海具身智能智脑研究院能否产出可规模化应用的技术成果,这两个问题的答案,会决定中国具身智能在全球坐标里的位置。

 
chengsenw
  • 本文由 chengsenw 发表于 2026年4月12日 00:42:04
  • 转载请务必保留本文链接:https://www.gewo168.com/44219.html
匿名

发表评论

匿名网友

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: