近日,Figure AI 发布的一段演示视频在科技圈刷屏:两台人形机器人在房间里协作铺床,整个过程流畅自然,没有人类遥控,两台机器人之间也没有显式的消息传递——它们完全通过”视觉”来感知和协调彼此的动作。
视频展示了什么
在演示视频中,两台 Figure AI 的人形机器人被放置在一个卧室环境中。它们需要完成的任务是整理床铺、铺设床单。这个看似简单的家务任务,对机器人来说涉及大量复杂的协调问题:
- 两台机器人需要同时抓住床单的不同角
- 需要同步拉伸、对齐,避免互相干扰
- 在折叠和整理时需要判断对方的位置和动作
整个过程中,两台机器人没有通过任何显式的消息传递来协调。它们完全依赖各自搭载的视觉系统来观察对方的动作,并实时调整自己的行为。这种协调方式,接近于人类之间的默契配合。
Helix 02 模型的技术突破
这次演示使用的是 Figure AI 自研的 Helix 02 模型。相比上一代,Helix 02 有以下技术突破:
- 纯视觉协调:不需要机器人之间建立通信通道,仅靠摄像头观察对方
- 完全自主:无遥控操作(no teleoperation),机器人自行决策
- 实时适应:在执行过程中能根据对方动作实时调整策略
- 通用任务能力:不只是铺床,可以处理各种家务和操作任务
商业化前景
Figure AI 目前估值已达 390 亿美元,是人形机器人赛道最受关注的公司之一。公司创始人 Brett Adcock 此前表示,目标是在家庭和工厂场景中大规模部署人形机器人。
这次协作铺床的演示,展示了多台机器人协同工作的可能性。这意味着未来一个家庭可能不是只有一台机器人,而是多台机器人分工合作来完成家务。
对行业的启示
- AI + 硬件加速融合:大模型能力正在快速向物理世界延伸
- 多 Agent 协作成为主流:不仅是软件层面,在物理世界中多 Agent 协作也在快速推进
- 视觉理解能力提升:纯视觉协调意味着模型对视觉信息的理解和推理能力达到了新高度
目前 Figure AI 的机器人尚未面向消费者销售,但从技术演示的成熟度来看,人形机器人进入家庭场景可能比我们想象的更近。
来源:IT之家
















Timothy Gowers Blog – A Recent Experience with ChatGPT 5.5 Pro

暂无评论内容