新物网

当前位置:首页 > 科技

科技

大车翻车,斯坦福超火机器人​​揭露内幕,研究员救援时受伤,网友:别担心

时间:2024-01-08 09:11:27
ALOHA,一夜之间便被曝出了这么多“笨手笨脚”的样子,也是引来不少网友的围观。然而,这次即使面对翻车铁证,网友们的画风却是一反常态:而这段翻车视频,正是机器人完全在自主模式下所犯的。这是我目前为止最喜欢的视频了,(不过)当机器人在你面前犯错的时候,你就不会觉得那么有趣了。

大车翻车,斯坦福超火机器人​​揭露内幕,研究员救援时受伤,网友:别担心

斯坦福流行的全能家务机器人 ALOHA 体型巨大! 转动! ! 车! ! !

你可能以为在上面擦上红酒就很容易了,但实际上是这样的:

我都给你摊开,顺便打碎一个杯子。

……

你以为它能变身厨师,熟练烹饪,结果它却给你当了锅底:

ALOHA 的翻车汽车系列还不止于此。

比如,我刚刚把锅里的虾煎完了。 哎呀,一不小心没抓到:

即使小弟冲上前,也无法阻止“悲剧”的发生(看来连手都被烫伤了)。

这场面真像庄太太扔碗的样子……

昨天还在“神社”上的ALOHA,一夜之间被曝出如此多的“笨拙”行为,也引起了不少网友的关注。

然而这一次,即使面对铁证如山,网友的态度却一反常态:

它并不完美,但很可爱。

总是有出错的空间。

最重要的是:

不担心。 (手动狗头)

究竟发生了什么?

斯坦福团队曝“丑闻”

原来,这段机器人翻车的视频是斯坦福大学ALOHA的作者Tony Z.Zhao发布的。

并且他还直言不讳地说:

机器人还没有准备好接管世界。

而这段翻车视频正是机器人在完全自主模式下所做的事情。

用作者的话说,这是“最愚蠢的错误”。

毕竟,除了我们刚才展示的几个例子之外,ALOHA 连锅都不能放进柜子里:

炸好的虾粘在锅上倒不出来,连碗的位置都找不到:

即使有笔,我也找不到合适的起点:

面对失败的收藏,作者开玩笑说:

这是迄今为止我最喜欢的视频,但当机器人在你面前犯错时,就没那么有趣了。

果然,我的手最终被烧伤了……

不过,今天作者透露,这个视频其实应该另有原因。

因为前两天ALOHA的神级场景的视频确实引起了很多人的关注,但是很多人都误以为是在自主模式下完成的。

但实际上,ALOHA采用的是混合模式,并不是完全自主的。 作者还呼吁网友边吃饭边仔细阅读论文和代码。

值得一提的是,作者还引用了2015年波士顿动力Atlas人形机器人“ ”并表示敬意。

也许这就是 科学家 Jim Fan 所说的:

一步一步来。

学习50次,成功率可达90%

就在这两天,ALOHA团队连续发布了三段爆款视频,展示了机器人敏捷灵巧的家务能力,让网友们惊叹不已。

包括做满汉全席(打鸡蛋、翻鸡都是信手拈来):

将枕套放在床单上:

给植物浇水、拖地、打开瓶盖,甚至逗猫:

那叫一个人形似人,上得厅堂,下得厨房。

然而,大多数都是由真人控制的,比如上面的那些。

为了更直观的看,可以看下面用纸擦玻璃的动画,一个人站在玻璃的正后方进行1:1的演示:

然而,对于一些相对简单的任务,比如这道炒虾:

它还可以洗锅、归还餐椅、叫乘电梯、擦桌子等,只需真人少量教学即可学会,然后无需人类即可独立操作。

具体来说,作者表示,上述简单动作只需要学习50次,就能达到90%的成功率——

经过测试,ALOHA可以连续9次擦掉溢出的酒、呼叫电梯5次,没有出现任何错误,保持了一定的稳定性。

此外,它还具有抗干扰能力。 将花盆放入柜子时,实验者不断向其前方扔杂物,但这丝毫不影响其性能:

训练期间根本看不见的椅子? 它还可以准确识别并完成寻的任务。

那么,作者是如何通过仅50次演示就让ALOHA实现自主任务的呢?

最关键的是通过ACT或扩散策略进行模仿学习,然后与静态操作数据联合训练机器人系统。

通过这种联合训练方法,可以显着提高机器人的性能,特别是对于需要精确操作的任务。

最后,我再次介绍一下斯坦福大学的这个机器人成果:

今年3月底正式发布,经历了8个月的迭代和2个月的测试。

作者一共有三位,其中两位是斯坦福大学计算机科学专业的中国博士生(最后一位是导师):

当时的机器人已经能够使用工具完成各种精确细致的任务,但仅限于固定的位置:

当然,幕后还有真人遥控器。

正如其名字 ALOHA 代表“低成本笔-”一样,这款机器人注重开源和低成本:

所有软件和硬件设计,包括代码和数据,都是一起发布的。 建设该系统仅花费3.2万美元(约合人民币22.7万元)。 作者还列出了所需的具体硬件。 有兴趣的朋友可以关注DIY。

机器人元年?

几乎与斯坦福爆出机器人的同时,谷歌也发布了自己的最新研究成果,而且一下子公布了三项:

一是改进模型,在保持相同操作精度的情况下,机器人的决策速度提高了14%,提高了10.6%;

一个是专门研究泛化能力的新框架。 它采用了一种新方法,将机器人完成前所未见的任务的成功率从29%提高到63%;

并且将使用一次可容纳20个机器人的收据收集系统,以加快训练机器人理解人类指令的能力。

这些新成果全部用于升级谷歌大型机器人型号RT-2。

与斯坦福的ALOHA相比,谷歌的RT-2在性能上仍然偏冷,但其所有效果都是完全自主的。

除了这两家公司之外,李飞飞的团队也一直在跟进。 其机器人系统已经可以理解人类语音并完成各种指令,无需额外训练。

这不禁让人想起很多人做出的“2024年将是机器人元年”的预测:

你认为它会实现吗?

参考链接:

本文来自微信公众号“量子位”(ID:),作者:金雷枫色,36氪经授权发布。