机器人AI领域或正迎来类似大语言模型的能力跃迁时刻 旧金山机器人初创公司Physical Intelligence近期公布了一项引人关注的研究成果。其新模型π0.7展示出了一种令人意外的能力:可以指挥机器人完成那些它从未接受过专门训练的任务。值得注意的是,这一能力甚至让该公司内部的研究人员也感到惊讶
旧金山机器人初创公司Physical Intelligence近期公布了一项引人关注的研究成果。其新模型π0.7展示出了一种令人意外的能力:可以指挥机器人完成那些它从未接受过专门训练的任务。值得注意的是,这一能力甚至让该公司内部的研究人员也感到惊讶。
公司联合创始人、加州大学伯克利分校的Sergey Levine教授对此进行了精炼的概括:这标志着机器人AI正从“机械记忆”转向“灵活泛化”。更重要的是,这种转变意味着其能力提升的速度,有望超越训练数据规模增长的线性轨迹。
虚拟币交易推荐使用币安交易所进行交易
苹果用户和电脑端用户也可以直接进入币安官网下载:点击访问币安官网下载注册
安卓用户可以直接下载币安安装包:点击下载币安安装包
若此项突破能获得外部验证,预计将对整个机器人行业的商业化进程产生重要影响。未来,机器人或许无需经历复杂的新数据采集与模型重新训练,就能直接部署到全新场景中,并实时优化自身操作。与此同时,有信息显示Physical Intelligence正在商讨新一轮融资,其估值可能从当前的56亿美元攀升至接近110亿美元。
成立仅两年的Physical Intelligence,其π0.7模型所展现的核心能力被研究团队称为“组合泛化”。简而言之,该模型能够将它在不同情境下学到的分散技能,像组合积木一样灵活拼接,用以解决一个从未遇到过的新问题。
这与以往机器人训练的主流模式形成鲜明对比。过去的常见做法本质上接近于“死记硬背”:针对“抓取水杯”收集数据、训练模型;再针对“拧开瓶盖”重复整套流程。而π0.7的出现,打破了这一固定范式。
Levine将这一转变类比于大语言模型领域曾发生的能力跃迁。他表示:“一旦跨越某个临界点,从只能完成有数据支持的任务,转变为能够以新方式重组既有技能,能力提升的速度就会超越数据量增长的线性比例。这种更有利的扩展特性,我们此前在语言与视觉领域已经观察到。”
整个研究中最具说服力的演示,恰恰来自一台模型在训练中几乎“未曾接触”的设备——空气炸锅。研究团队事后核查发现,在整个庞大的训练数据集中,仅存在两条相关记录:一条是另一台机器人将空气炸锅推关,另一条则来自开源数据集,记录了一台机器人按指令将塑料瓶放入其中。
然而,π0.7却成功地将这两段碎片化信息,与更广泛的网络预训练数据相结合,形成了对该设备运作方式的功能性理解。在没有任何额外提示的情况下,模型便尝试使用空气炸锅烹饪红薯,并取得了基本可接受的结果;而在获得逐步的语言引导后,任务最终顺利完成。
Physical Intelligence的研究员、斯坦福大学博士生Lucy Shi分享了一个早期实验中的显著变化:初始成功率仅为5%,但在花费约半小时优化任务描述方式后,成功率大幅提升至95%。她坦言:“有时问题不在于机器人或模型本身,而在于我们——提示词的工程优化尚未到位。”
研究科学家Ashwin Balakrishna的感受则更为直接。他表示,过去总能依据训练数据预判模型的能力边界,“但过去几个月是我首次真正感到意外。我随手买了一套齿轮,询问机器人能否转动它,它就直接完成了。”
当然,研究团队对模型当前的局限性保持着清醒与坦诚的态度。目前,π0.7尚无法仅凭一句高层级指令,就自主完成复杂的多步骤任务。“你不能直接对它说‘去给我烤一片吐司’,”Levine举例说明,“但如果你逐步引导它——‘对于烤面包机,先打开这部分,再按下那个按钮,执行这个操作’——它通常可以很好地完成。”
此外,机器人领域目前缺乏标准化的基准测试体系,这给外部独立验证带来了相当难度。Physical Intelligence选择将π0.7与自家此前针对特定任务的专项模型进行对比,结果显示,这一通用模型在制作咖啡、折叠衣物、组装纸箱等复杂任务上,已达到了与专项模型相当的水平。
这种审慎态度也体现在研究论文的表述中。研究者将π0.7描述为展现出泛化能力的“早期迹象”与“初步演示”。当被直接问及基于该研究的系统何时能够实际部署时,Levine并未给出具体预测:“我们有充分理由保持乐观,进展速度也比我两年前预期的更快。但这个问题目前很难给出确切答案。”
尽管前路仍需探索,资本市场的关注度已显著升温。Physical Intelligence至今累计融资已超过10亿美元,最新估值为56亿美元。据相关报道,公司目前正就新一轮融资进行洽谈,估值可能接近翻倍,达到110亿美元。
投资者对这家公司的信心,部分源于联合创始人Lachy Groom的过往背景。Groom此前是硅谷备受关注的天使投资人之一,曾成功投资Figma、Notion和Ramp等知名公司。在决定共同创立Physical Intelligence之前,他已将其视为自己长期寻找的那类企业。这一背景帮助该初创公司吸引了大量机构资金,尽管公司始终未向投资者提供明确的商业化时间表。
谈及外界可能存在的质疑,Levine预先回应了潜在的批评方向:“对于任何机器人泛化演示,总可以提出的质疑是——任务太简单了,机器人又没在做高难度特技。”但他对此给出了自己的见解:真正具备泛化能力的机器人系统,其外观表现或许永远不如精心设计的特技演示那样令人惊叹,但其实际应用价值却可能高得多。这才是问题的关键所在。
侠游戏发布此文仅为了传递信息,不代表侠游戏网站认同其观点或证实其描述