游戏传奇首页
游戏我的天下首页
最好看的新闻,最实用的信息
03月26日 23.6°C-26.7°C
澳元 : 人民币=4.56
悉尼
今日澳洲app下载
登录 注册

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图)

20小时前 来源: 一条 原文链接 评论0条

机器人巡逻、扭秧歌、煎蛋、进厂打工……

今年春晚之后,

人形机器人从科幻片场走入现实,

一夜成为“赛博顶流”。

宇树Unitree因太火爆遭断货下架,

多家机器人公司宣布加速出货,

业界宣布“2025年有望成为机器人量产元年”。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 1

上海浦东的智元数据集采厂,机器人正在跟人类“学做家务”

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 2

来自硅谷的人形机器人Figure02,已经能够行云流水地操作一些简单的家务活

与此同时,全国多地出台新政

支持具身智能机器人的产业发展。

在上海浦东,全国首个“人形机器人训练场”启用,

通过收集、整理机器人的动作捕捉数据,

给机器人造出更好的“超级大脑”。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 3

姚卯青本科毕业于清华大学,博士毕业于美国南加州大学,曾经是Google和Oracle高级工程师,现在为智元合伙人、具身业务部总裁

国内的人形机器人“进化”到哪一步了?

机器人成为家庭标配,还有多远?

等机器人养老,现实吗?

3月初,一条采访了前谷歌高级工程师、

智元机器人合伙人姚卯青,

姚卯青预测:

“人形机器人走进家庭,还需5年左右时间,

价格最终大概能降到10万元以内。”

同时,更多的安全和伦理问题也在未来等着我们……

编辑:韩嘉琪

责编:陈子文

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 4

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 5

新加坡的社交机器人Dexie,上班时“活力满满”,下班后“高位截瘫”

两年前,活力女孩“Dexie”空降新加坡的一家养老院,宣布要成为老年人的新型养老搭子。

Dexie是一个人形机器人,颜值在线,有柔软触感的硅胶皮肤,还会把嘴巴嘟成圆圆的“O”字。每天早晨,它都会坐着带领老人们做健身操,一边唱歌,一边拍手。

但其他时间里,Dexie更像一个“高位截瘫”的大号娃娃,只能靠身下的“轮椅”缓缓移动,既无法直立行走,也不能在行动上给予老人帮助。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 6

日本软银推出的类人机器人Pepper,情商很高,但不会干活,2020年正式退役

主打陪伴,一直是过去10年来人形机器人的招牌卖点。2015年,日本软银推出主打“类人机器人Pepper,Pepper身高1米2,有灵动的大眼睛、带独立关节的5指,脚部是一个能够平稳移动的轮盘,可以识别人类的情绪、和人类对话,擅长眨眼卖萌。问世之初,Pepper曾在一分钟内被抢购一空,很多公司、银行、餐厅都请它当人气迎宾。

但在2020年夏天,Pepper宣布停产。上市一段时间后,Pepper的软肋暴露——可爱但不中用。虽然Pepper拥有看似灵活的手指,但实际的抓握能力很弱,甚至很难平稳地端送一杯水,除了四处移动,跟大家甜言蜜语,很难指望它承担什么其他重任。

这是人形机器人曾经不被看好的原因:一个只会给足情绪价值的“社交达人”。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 7

美国波士顿劳力推出的“Atlas”,曾经被称为人形机器人界的“王者”,但因为苦于商业变现,被公司多次易手

另一方面,人形机器人的研发极度烧钱,不确定性很高、回报周期漫长,初代的人形机器人公司大多都陷入了财政危机,其中就包括于2013年推出过“双足机器人天花板”Atlas的美国公司波士顿动力。

直到2022年底,ChatGPT的横空出世让AI技术发生了质的飞跃,这才给沉寂许久的人形机器人行业重新点燃了希望。

嵌入大语言模型后,机器人有了更强的自然语言与推理能力,不再只是按部就班地执行指令,而是能够理解人类意图,像人一样思考和决策。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 8

宇树科技的机械狗与机器人

很快,国内的人形机器人企业开始密集生长。智元机器人、银河通用等新兴创业公司成立,小米、蔚来、小鹏等车企纷纷入局,宇树科技也在这一阶段从“机械狗”转向了“机器人”的研发。

由于整个行业仍在初期探索阶段,所以各家公司的技术路线五花八门。有的企业是“造身派”,关注机器人本体,包括电机、传感器、控制器、减速机等硬件;有的公司是“造脑派”,把更多的精力投入在AI模型、软件算法上。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 9

宇树机器人在今年的春晚上表演扭秧歌

机器人长出双腿双手,有了“人样”还远远不够。作为一种通用形态,一个合格的人形机器人必须能够胜任各种环境里的各种任务。既不能只是会跳舞的耍宝戏精,也不能只是高情商的对话音箱。

机器人要去完成一件任务,需要的是交互操作的能力,姚卯青告诉一条:“要有对环境的理解和预测,对(空间)几何的一些理解规划。”

想象这样一个场景:小朋友在客厅玩耍打闹,人形机器人需要把煮好的鸡蛋和米粥端到餐桌上,避免把汤汁洒在到处走动的小朋友身上,还要把凌乱的餐桌整理出放菜的空间,最后为孩子们盛粥、剥鸡蛋。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 10

电影《机械姬》

这套动作背后,需要机器人能够感知环境,能预判熊孩子的跑动轨迹;也需要做任务规划,端菜时同步餐桌整理;还需要恰当好处的力度控制,剥开鸡蛋壳却不会把鸡蛋捏碎。

于是,“具身智能”的概念随即被提出——人形机器人要用身体感知世界、认识世界、与环境互动。

要获得这种能力,对机器人的AI能力和硬件基础都提出了极高的要求。机器人不仅需要发达的“神经”(触觉传感器),也需要一个能调整重心的脚踝(动态平衡算法),以及能从摔跤中总结经验的数字大脑(强化学习的能力)。

而这也意味着,我们期待人形机器人用数年时间追赶人类用上百万年进化出的复杂智能。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 11

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 12

位于上海浦东的智元数据集采厂,总面积达3000多平方米

在上海浦东,一个3000平米的机器人“训练基地”里,一百多台人形机器人日日夜夜地接受超高强度的集训。

这些机器人像懵懂的人类幼仔一样,通过触摸、试错感知物理世界:在卧室区叠裤子、烫衣服,在厨房炒菜、榨果汁、刷盘子,在客厅插花、拖地板、整理杂乱的桌面……每个机器人身边都配备了一名“导师”——头戴VR设备的数据采集员,他们用手柄远程示范动作,给机器人示范动作,抓、握、提、拉、倒,一个小动作要不厌其烦地重复200遍左右。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 13

数据集采员耐心“教授” 机器人每一个动作

这是智元的数据采集超级工厂,也是全球唯二规模化的机器人数据采集中心。整个工厂分为5大类场景:家居、餐厅、工业、商超和办公,总共有100位采集员分日班和夜班教学,此外,还有30多位数据审核员和10位数据运营管理人员,确保数据的有效性。

一天下来,工厂能够生产3万到5万条真机数据——即通过机器人实操采集到的环境感知、动作轨迹、力学反馈等包含多维度信息的数据。

有时候,机器人也会“开小差”,水壶没拿稳、炒菜调料撒多了、花瓶打翻了……数采员就会耐心地给它们纠错。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 14

机器人在练习刷马桶

这些机器人训练成果如何?姚卯青介绍:“现在仍处在比较早期的阶段,一个机器人在它见过的桌面上倒水,有90%左右的成功率。”对于它没见过的场景和物品,机器人可能就会措手不及。另外,这些动作主要还是一些单点的能力,还不太能串起来多种动作。

为了让机器人拥有在不同场景里“举一反三”的泛化能力,采集员要不断地调试环境,比如改变光线和光源位置,倒水时更换不同造型的水杯,调整物体摆放的位置等等。

数据采集,是构建机器人“AI能力”(“脑力”)的基础工程。通过收集视觉、触觉、关节运动轨迹等多维度物理交互数据,然后再给多模态大模型提供认知养料,最终才能被部署到机器人本体,完成从数字认知到物理执行的闭环进化。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 15

“擎天柱”的数据采集员需要穿戴动作捕捉设备为机器人采集数据,撰写日报,时薪高达48美元(约合344元人民币)

但数据匮乏,是具身智能机器人发展道路上的最大瓶颈。

姚卯青坦言:“机器人的数据太少了,很难跟大语言模型的数量级去相提并论。”究其原因,是因为大语言模型的训练依赖的是互联网上的海量文本,而具身智能机器人依赖的是真实世界的物理交互数据。比如机器人每学倒一次水,都需要采集员记录手臂轨迹、握力变化、水温触感等多维度信息。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 16

擎天柱在工厂装电池

这也意味着真机数据的集采成本高昂。英伟达研究中心的工作人员曾对媒体透露,光让特斯拉的人形机器人“擎天柱”把电池放进盒子这一个动作,就需要40人的团队进行数据集采;如果让擎天柱具备真正的“下厂工作”的能力,需要数百万小时的数据训练,花费至少上亿美元。

为了解决这个困境,全球有多家人形机器人公司开源了自己的数据集,其中就包括国内的智元、傅利叶等公司,希望能够推动行业内的技术共享。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 17

智元机器人通过最新的GO-1通用具身基座大模型,可以完成送餐任务

除了“1V1的人类教学”,还有一种性价比更高的培训方式也在同步进行——通过给机器人“投喂”大量的人类教学视频和图文,帮助它们理解人类的动作操作。

今年3月,智元机器人发布了全国首个“通用具身基座大模型”,通过分析人类家务视频,比如观看短视频网站上的烹饪教程,就可以让机器人在还未进行实操(零样本)的情况下,也能推理出一些做饭的简单常识,比如“水烧开会冒泡”“土豆需要削皮”等等。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 18

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 19

本照片由一条编辑部使用AI生成

机器人进家的最大难点在于什么?

市面上,一些人形机器人的“下半身”发育已经相对成熟,可以跑跳、爬坡、扎马步,音乐响起,还能来段广场舞、做后空翻。但这些任务,更像是逢年过节拉家里的小朋友展示才艺,离真正的日常应用还有十万八千里。

“上半身”,才是进家干活的关键。姚卯青拆解了上半身操作的两个难点:对动作的精度要求很高、和物体有复杂的交互。“像做饭、倒水、端茶、开门,有千百种的操作种类,而且上半身的轨迹会非常复杂。而下半身,和物体没有复杂交互,无外乎就是迈步子这样一种形态。”

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 20

机器人手部的柔韧性、灵活性比起人类还相距甚远

很多动作,对人类轻而易举,但对机器人来说却难如登天。“比如插USB这个小动作,它对动作的精度要求非常高,二是没法只依赖视觉的输入就去判断是否成功”,姚卯青解释,人在插USB、充电器的时候,经常要反复尝试,机器人同样,“它还需要很多力矩的反馈来去实现这种闭环控制。”

再比如简单的揉面团、切菜,也对机器人手部的灵活和柔韧性提出了极高的要求。手是人体关节最集中、感觉最集中的区域之一,也是人形机器人最难模拟的部位。“很多机器人只有一个两指的夹爪,只能像一双筷子一样去夹取东西。”

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 21

德国协作机器人公司NEURA 的“灵巧手”

目前有一些机器人已经拥有了灵巧手,但它的自由度跟人的手还是相差甚远。“人的手应该有20多个自由度,现在市面上量产的机械手很多只有6、7个。”

成本也是大问题,在手上每增加一个自由度,就要加多加塞一套电机、编码器和传动装置,一双“像人的手”往往价格不菲,可高达10万元一只。此外,灵巧手很重,“现在一只手可能要一公斤多,怎么才能把它做到小型化、轻量化,这个也比较难。”

近一年来,社交媒体上陆续出现了“养老人形机器人”的风声,但姚卯青认为,这些产品大多都还停留在概念阶段。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 22

斯坦福联合谷歌推出的“保姆机器人”,外形粗犷,泛化能力也被广泛质疑

人形机器人养老,最大的软肋就是“体力不支”,即机器人的载重能力不达标。当下,人形机器人的手臂负重通常在5公斤左右,根本无法像人类护工一样给老人提供基础的翻身、看护服务,更别说安全准确地拖动一位100多斤的成年人。

“某些专用形态的机器人,可以做到比较大的力矩,因为可以牺牲掉很多构型,包括成本,还有体积上的限制。”

比如,2024年,美国斯坦福大学联合谷歌推出的“保姆机器人”Mobile ALOHA,能做饭、洗衣、擦玻璃、浇花,但外形上,和“人”沾不上半点关系,更像是两只能够移动的机械臂。但即使如此,它的成本也要高达3.2万美元。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 23

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 24

2024年,优必选机器人已经率先进厂测试

最近,多家机器人公司开始了量产试水阶段。去年下半年,傅利叶的双足人形机器人GR-1交付超过100台;今年1月,智元下线了1000台人形机器人。此外,国内的30多家企业已经宣布将于今年进行商业化量产,主要针对B端。

但距离年产几十万台的量产规模,还要3到5年。姚卯青预测:“进入家庭,需要5年,最终大概能降到10万元以内。”

此外,一台人形机器人的成本依旧高昂。特斯拉擎天柱,仅材料费就高达4.13万美元一台(约合人民币29.9万);优必选的Walker系列在2021年至2023年的销售均价为598万元;宇树“会扭秧歌”的Unitree G1虽然价格一度低达9.9万元,但有不少买家在网上吐槽,“更像是一个动作丝滑的大号玩具。”

除了成本,还有供应链问题。能够生产高精度、高性能零部件的厂商数量依然有限,“现在量产过程中的难点(之一)是供应链不是很成熟,所以还很难做到大规模下的高良率、一致性等等。”

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 25

Figure机器人在物流中心进行快递分拣工作,但“手速”比起人类还差一大截

在进入家庭之前,工业场景是人形机器人的应用第一站。

2024年,全球多家公司的人形机器人率先开始“进厂拧螺丝”。这些机器人从最简单的搬运、分拣任务开始练习,在不同场景里试错,一步步累积经验,然后再“上手”更复杂、更精密的操作任务。

由OpenAI投资的、来自硅谷的Figure 02已经可以每天工作20小时,成为机器人届的“卷王”;来自深圳的优必选Walker S1 批量进入5G智慧工厂,能够和其他的机器人搭子团队合作;乐聚机器人的“夸父”也扎入江浙沪的多家工厂里,进行验证测试。

不过,流水线更像是机器人的“新手村”,家庭空间才是“地狱难度”的考核。工业环境下,机器人的工作高度重复,场景相对单一固定。但家庭环境里,“人”是最大的不确定因素,机器人撞上车间的货物没有大碍,但是不小心伤到人就会后果惨重。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 26

本照片由一条编辑部使用AI生成

这对机器人的安全性提出了极高的要求。

“现在普遍来讲,全尺寸1米7的人形机器人整机能做到这种50公斤左右,算是一个比较不错的水平。但一个100多斤的机器人摔倒了,其实很难一个人去把它扶起来,而且很可能把地板砸一个洞。”姚卯青告诉我们。

机械臂的力度堪比泰森,也是行业普遍的担忧。2022年,在莫斯科的一场国际象棋比赛上,一名7岁的男孩因为抢先一步出棋,被机器人对手夹住了手指,造成指骨骨折。机械臂自重大、速度快,杀伤力不可低估。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 27

某发布会上,人形机器人突然抽搐摔倒

因此,给机器人“减重”(轻量化)是未来机器人量产的必经之路,更轻的自重也可以提升机器人的动作准确性。

另一个“安全红灯”来自于电池。目前人形机器人主流使用的锂电池,耗电量很大,续航时间短,大多只能持续2小时左右。春晚的舞台上,机器人表演结束后,还是需要被舞者扶着脖子下台,跳完舞累趴下的情况也常有发生。

当人与人形机器人共居的那天接近,更多的伦理问题也会涌现——机器人究竟是家庭一员还是只是一个工具?如何保证机器人的数据安全,避免泄露住户隐私?安全责任应该如何界定?

也许就像汽车普及前需要交通法一样,在迎接“人形机器人进家”之前,我们还需要新的文明规则和伦理框架。未来,仍有漫漫长路。

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 28

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 29‍‍‍‍‍‍

揭秘人形机器人训练营:24小时端茶、煎蛋、拖地…(图) - 30

今日评论 网友评论仅供其表达个人看法,并不表明网站立场。
最新评论(0)
暂无评论


Copyright Media Today Group Pty Ltd.隐私条款联系我们商务合作加入我们

分享新闻电话: (02) 8999 8797

联系邮箱: info@sydneytoday.com 商业合作: business@sydneytoday.com网站地图

法律顾问:AHL法律 – 澳洲最大华人律师行新闻爆料:news@sydneytoday.com

友情链接: 华人找房 到家 今日支付Umall今日优选