你追我赶！英伟达、Meta同日宣布机器人重磅成果

时事新闻2023-10-22 10:08:55无忧百科

《科创板日报》10月21日讯（编辑宋子乔） 如今，科技巨头主动肩负起机器人研发的重任，正你追我赶奔赴下一场科技盛宴。当地时间10月20日，英伟达、Meta各自发布了重磅机器人训练工具。

英伟达开发的AI代理Eureka可以教会机器人复杂的运动控制技能，比如转笔、打开抽屉和柜子、抛球和接球、操作剪刀。英伟达称这一突破将重新定义机器学习。

Meta则推出了Habitat 3.0模拟器，可教授机器人如何与物理世界进行交互，Meta将其称为“社交智能机器人研发路上的里程碑”。

究竟是什么样的工具？新成果的意义何在？

▌英伟达Eureka——大模型参与训练机器人

Eureka的全称是Evolution-driven Universal Reward Kit for Agent，本质是一种由大模型驱动的算法生成工具。借助GPT-4写代码的能力，Eureka拥有了出色的奖励函数设计能力，可以自主编写奖励算法来训练机器人。

Eureka的关键所在，是通过上下文来实现了人类水平的奖励算法设计。简单来说，就是用GPT-4的零样本生成、代码编写以及上下文改进功能，对奖励执行策略进行优化，由此通过强化学习来进行复杂的技能。

英伟达称，在29种不同的开源强化学习（RL）环境中，Eureka奖励设计的性能达到了人类水平，这些环境包括10种不同的机器人形态（四足机器人、四旋翼机器人、双足机器人、机械手以及几种灵巧手）。在没有任何特定任务提示或奖励模板的情况下，Eureka生成的奖励程序在超过80%的任务上优于专家编写的奖励程序。这使得机器人的平均性能提高了50%以上。

机器人通过Eureka学会了转笔、打开柜子、抛接球（注：这些机械手指上下翻飞的场景，暂时仅限于虚拟环境）

人形机器人通过Eureka学习跑步步态

英伟达这项研究由其与宾夕法尼亚大学、加州理工学院、德州大学奥斯汀分校的研究人员合作完成。目前该项目完全开源。

在机器人领域，有一个“莫拉维克悖论”——人类所独有的高阶智慧能力只需要非常少的计算能力，但无意识的技能和直觉（如辨识人脸、举起铅笔、在房间内走动、回答问题等能力）却需要极大的运算能力，即越简单的事情越难，越难的事情越简单。

这也是为什么人类早已创造出打败世界顶级棋手的AlphaGo，却仍不能让机器人拥有像两三岁小孩一样的感知力和行动力。

英伟达的最新成果展示了大模型在机器人精细化控制方面的作用，在英伟达的推动下，更智能的机器学习方式有望被迅速引入工业和消费应用领域。

▌Meta Habitat——人机交互直指具身智能

Meta的Habitat同样为训练机器人而生。据介绍，Habitat 3.0是第一个支持在多样化、逼真的室内环境中，就人机交互任务进行大规模训练的模拟器。

具体来看，Habitat 3.0可以利用红外捕捉系统精心构建一个虚拟环境，如办公空间、住宅和仓库等，其中物体的形状和大小完全复制现实世界，该工具还可在外貌和姿势上对人类进行真实的模拟，支持从简单（如行走和挥手）到复杂（如与物体交互）等各种类型的动作，还可模拟多种真实的社交场景。

虚拟环境中的人形化身既可由学习到的策略控制，也可由真人通过键盘、鼠标以及VR头显等进行控制。网上已经有人期待在Meta Quest VR中体验Habitat 3.0了。

Meta的目的很明确——通过Habitat 3.0，让AI智能体在真实世界和人类互动。

值得注意的是，与真实世界进行交互正是实现具身智能的基础，正如Meta的AI研究部门（FAIR）所说，Habitat 3.0等新产品的发布代表了他们在具身智能方面的进步。

FAIR表示，Habitat 3.0将把机器人AI代理的学习时间从几个月甚至几年缩短到几天。它还能在安全的模拟环境中更快速地测试新模型，不会有任何风险。

在推出Habitat 3.0的同时，Meta还宣布发布Habitat合成场景数据集（Habitat Synthetic Scenes Dataset），这是一个由艺术家撰写的三维数据集，可用于训练人工智能导航代理；同时还发布了Home Robot，这是一个机器人助手软硬件平台，可在模拟和真实环境中使用。