《科创板日报》10月21日讯(编辑 宋子乔) 如今,科技巨头主动肩负起机器人研发的重任,正你追我赶奔赴下一场科技盛宴。当地时间10月20日,英伟达、Meta各自发布了重磅机器人训练工具。
英伟达开发的AI代理Eureka可以教会机器人复杂的运动控制技能,比如转笔、打开抽屉和柜子、抛球和接球、操作剪刀。英伟达称这一突破将重新定义机器学习。
Meta则推出了Habitat 3.0模拟器,可教授机器人如何与物理世界进行交互,Meta将其称为“社交智能机器人研发路上的里程碑”。
究竟是什么样的工具?新成果的意义何在?
▌英伟达Eureka——大模型参与训练机器人
Eureka的全称是Evolution-driven Universal Reward Kit for Agent,本质是一种由大模型驱动的算法生成工具。借助GPT-4写代码的能力,Eureka拥有了出色的奖励函数设计能力,可以自主编写奖励算法来训练机器人。
Eureka的关键所在,是通过上下文来实现了人类水平的奖励算法设计。简单来说,就是用GPT-4的零样本生成、代码编写以及上下文改进功能,对奖励执行策略进行优化,由此通过强化学习来进行复杂的技能。
英伟达称,在29种不同的开源强化学习(RL)环境中,Eureka奖励设计的性能达到了人类水平,这些环境包括10种不同的机器人形态(四足机器人、四旋翼机器人、双足机器人、机械手以及几种灵巧手)。在没有任何特定任务提示或奖励模板的情况下,Eureka生成的奖励程序在超过80%的任务上优于专家编写的奖励程序。这使得机器人的平均性能提高了50%以上。
机器人通过Eureka学会了转笔、打开柜子、抛接球(注:这些机械手指上下翻飞的场景,暂时仅限于虚拟环境)
人形机器人通过Eureka学习跑步步态
英伟达这项研究由其与宾夕法尼亚大学、加州理工学院、德州大学奥斯汀分校的研究人员合作完成。目前该项目完全开源。
在机器人领域,有一个“莫拉维克悖论”——人类所独有的高阶智慧能力只需要非常少的计算能力,但无意识的技能和直觉(如辨识人脸、举起铅笔、在房间内走动、回答问题等能力)却需要极大的运算能力,即越简单的事情越难,越难的事情越简单。
这也是为什么人类早已创造出打败世界顶级棋手的AlphaGo,却仍不能让机器人拥有像两三岁小孩一样的感知力和行动力。
英伟达的最新成果展示了大模型在机器人精细化控制方面的作用,在英伟达的推动下,更智能的机器学习方式有望被迅速引入工业和消费应用领域。
▌Meta Habitat——人机交互直指具身智能
Meta的Habitat同样为训练机器人而生。据介绍,Habitat 3.0是第一个支持在多样化、逼真的室内环境中,就人机交互任务进行大规模训练的模拟器。
具体来看,Habitat 3.0可以利用红外捕捉系统精心构建一个虚拟环境,如办公空间、住宅和仓库等,其中物体的形状和大小完全复制现实世界,该工具还可在外貌和姿势上对人类进行真实的模拟,支持从简单(如行走和挥手)到复杂(如与物体交互)等各种类型的动作,还可模拟多种真实的社交场景。
虚拟环境中的人形化身既可由学习到的策略控制,也可由真人通过键盘、鼠标以及VR头显等进行控制。网上已经有人期待在Meta Quest VR中体验Habitat 3.0了。
Meta的目的很明确——通过Habitat 3.0,让AI智能体在真实世界和人类互动。
值得注意的是,与真实世界进行交互正是实现具身智能的基础,正如Meta的AI研究部门(FAIR)所说,Habitat 3.0等新产品的发布代表了他们在具身智能方面的进步。
FAIR表示,Habitat 3.0将把机器人AI代理的学习时间从几个月甚至几年缩短到几天。它还能在安全的模拟环境中更快速地测试新模型,不会有任何风险。
在推出Habitat 3.0的同时,Meta还宣布发布Habitat合成场景数据集(Habitat Synthetic Scenes Dataset),这是一个由艺术家撰写的三维数据集,可用于训练人工智能导航代理;同时还发布了Home Robot,这是一个机器人助手软硬件平台,可在模拟和真实环境中使用。
英伟达深耕运动控制,Meta注重交互能力,这两大能力正是机器人进入千家万户的前提。
华为“天才少年”稚晖君离开华为后奔赴机器人创业,他曾在其机器人产品首秀上引用一个网络段子:我们想让AI做的事,是做饭、打扫房间、洗衣服、扔垃圾,然而它们实际在做的事,是聊天、绘画、写作、作曲、打游戏……
工业机器人已经愈发普及的当下,如何让机器人成为普通家庭的助手、日常生活中的伙伴,已经成为新的科技热点。
一个包揽家务活、零碎事的家用机器人,距离我们还有多远呢?