研究人员帮助机器人进行抽象思考和计划

2019-06-20 16:36:56 编辑：来源：

导读布朗大学和麻省理工学院的研究人员开发出一种方法，通过构建周围世界的抽象表示来帮助机器人规划多步骤任务。他们的研究发表在人工智能研究

布朗大学和麻省理工学院的研究人员开发出一种方法，通过构建周围世界的抽象表示来帮助机器人规划多步骤任务。他们的研究发表在人工智能研究杂志上，是朝着建造能够像人一样思考和行动的机器人迈出的一步。

对于机器人来说，规划是一件非常困难的事情，主要是因为他们如何看待并与世界互动。甲机器人的世界的感知包括无非由其照相机采集的像素的繁多更多，并且其采取行动的能力被限制在设置控制其接头和夹具各个电机的位置。它缺乏对这些像素如何与我们在世界上可能认为有意义的概念相关的天生的理解。

布朗的计算机科学助理教授，新研究的主要作者乔治科尼达里斯说：“与世界的低级界面使人们很难决定做什么。” “想象一下，如果你不得不考虑你想要到达的每一块肌肉，那么计划像去杂货店一样简单的东西是多么困难，并提前和详细想象数TB的视觉数据。一路走过你的视网膜。你会立刻陷入细节之中。人们当然不会那样计划。我们能够引入抽象的概念，抛弃那么多无关紧要的细节和只关注重要的事情。“

即使是最先进的机器人也无法实现这种抽象。当我们看到机器人计划和执行多步骤任务的演示时，“几乎总是如此，程序员已明确告诉机器人如何思考这个世界以便制定计划，”Konidaris说。“但如果我们想要能够更自主地行动的机器人，他们将需要自己学习抽象的能力。”

在计算机科学术语中，这些类型的抽象分为两类：“程序抽象”和“感知抽象”。程序抽象是由低级别动作组成的程序，由较高级别的技能组成。一个例子是捆绑打开门所需的所有小动作 - 所有涉及到旋钮的电机运动，转动它并将门拉开 - 进入单个“打开门”技能。一旦建立了这样的技能，您就不必担心它是如何工作的。您需要知道的是何时运行它。他说，机器人专家 - 包括Konidaris本人 - 一直在研究如何让机器人多年来学习程序抽象。

但根据Konidaris的说法，在感知抽象方面的进展较少，这与帮助机器人理解其像素化环境有关。这是这项新研究的重点。

在这项研究中，研究人员将一个名为Anathema Device(或Ana，简称Ana)的机器人引入一个房间，该房间内有一个橱柜，一个冷却器，一个控制橱柜内灯光的开关，以及一个可以留在冷却器中的瓶子。或橱柜。他们给Ana一套高级运动技能，用于操纵房间内的物体 - 打开和关闭冷却器和橱柜，翻转开关并拿起一个瓶子。然后他们让Ana松了一口气，在房间里试用她的运动技能，在每次执行技能之前和之后记录她的相机和执行器的感官数据。这些数据被输入到团队开发的机器学习算法中。

研究人员表明，Ana能够学习一个非常抽象的环境描述，其中仅包含了她能够执行特定技能所必需的内容。例如，她了解到，为了打开冷却器，她需要站在前面而不要拿任何东西(因为她需要双手打开盖子)。她还学会了与冷却器盖子关闭相关的视野中像素的正确配置，这是唯一可以打开它的配置。

她学到了与她的其他技能相关的类似抽象。例如，她了解到橱柜内的灯光非常明亮，以至于它的传感器变亮了。因此，为了操纵橱柜内的瓶子，灯必须关闭。她还了解到，为了关灯，需要关闭橱柜门，因为打开的门阻挡了她对开关的接触。由此产生的抽象表示将所有知识从高清图像提取到文本文件，只有126行。

“这些都是关于她周围环境的重要抽象概念，”科尼达里斯说。“门需要在打开之前关闭。除非它打开，否则你不能将瓶子从柜子里拿出来，等等。而且只要执行她的技能并看到会发生什么，她就能学会它们。”

一旦Ana手持她学到的抽象表现，研究人员就要求她做一些需要一些计划的事情：从冷却器中取出瓶子并将其放入橱柜中。

正如他们希望的那样，安娜航行到冷却器并打开它以露出瓶子。但她没有接受它。相反，她提前计划了。她意识到，如果她把瓶子放在她的抓手里，那么她将无法打开橱柜，因为这样做需要双手。因此，在打开冷却器后，她导航到了橱柜。在那里，她看到灯开关处于“开”位置，她意识到打开柜子会挡住开关，所以她在打开柜子之前关闭了开关，返回冷却器并取回瓶子，最后放置它在橱柜里。简而言之，她提前计划，发现问题并在问题发生之前加以解决。

“我们没有向Ana提供她为计划任务所需的任何抽象陈述，”Konidaris说。“她自己学习了这些抽象，一旦有了这些抽象，计划很容易。她发现这个计划只有大约4毫秒。”

Konidaris表示，该研究为将人工智能应用于机器人技术提供了重要的理论基础。他说：“我们相信让我们的机器人能够抽象而不是具体地进行规划和学习，这将是构建真正智能机器人的基础。” “如果你以正确的方式思考问题，很多问题往往都很简单。”

Konidaris的合着者是来自麻省理工学院的Leslie Pack Kaelbling和Tomas Lozano-Perez。该研究得到了国防高级研究计划局和麻省理工学院情报计划的奖励。

标签：帮助机器人