您的位置: 首页 >科技 >

SLAP是在不确定性下运行的自主机器人的关键能力

2019-06-10 11:04:18 编辑: 来源:
导读 美国宇航局喷气推进实验室(JPL),德克萨斯A&M大学和卡内基梅隆大学的研究人员最近开展了一项研究项目,旨在实现自动机器人的同步定位和规划

美国宇航局喷气推进实验室(JPL),德克萨斯A&M大学和卡内基梅隆大学的研究人员最近开展了一项研究项目,旨在实现自动机器人的同步定位和规划(SLAP)功能。他们在IEEE机器人交易中发表的论文提出了信念空间中的动态重新规划方案,这对于在不确定条件下运行的机器人尤其有用,例如在不断变化的环境中。

“在现实世界中运行的机器人需要应对不确定性,”进行这项研究的研究人员之一Sung Kyun Kim告诉TechXplore。“例如,火星探测器将导航到科学目标位置,但它也需要避免与障碍物碰撞。因此,准确的本地化和经济有效的路径规划都是必不可少的能力。”

SLAP是在不确定性下运行的自主机器人的关键能力,允许他们有效地导航空间,避开障碍物并规划他们到目标位置的路径。甲机器人在不确定性下的顺序决策过程可以配制为POMDP(部分可观察马尔可夫决策过程),其需要在线连续地解决。然而,确保机器人有效和准确地解决POMDP可能是相当具有挑战性的。

“我们提出了解决SLAP问题的两个主要想法,”Kim解释道。“一个是利用反馈控制器使信念状态可达。这可以有效地打破历史的诅咒,这有助于我们解决更大的问题。另一个是在运行时动态重新定义和改进决策,增强解决方案质量和稳健性。当存在系统建模错误,动态环境变化或间歇性传感器/执行器故障时,动态重新计划尤其有用。“

Kim和他的同事在信念空间中设计了一种动态重新规划方案,允许机器人在不确定的情况下有效地导航它们周围的空间,例如在变化的环境中或出现意外障碍时。他们的算法有两个阶段,离线和在线。

“在离线阶段,我们的算法在信念空间中构建一个稀疏图,每个节点都有一个反馈控制器,然后在图上解决粗略的全局策略(决定在当前信念状态下采取什么行动),”Kim说。“在线阶段,每次更新信念状态时都会进行动态重新计算。算法会在图形上本地评估移动到附近节点的每个动作,并选择成本最低的节点。执行所选动作并更新后目前的信念,它重复了重新计划的过程。“

Kim和他的同事设计的方案利用了信念空间中反馈控制器的行为。换句话说,反馈控制器充当信念空间中的漏斗,附近的信念状态可能与控制目标信念状态收敛。这有效地解决了在规划期内解决POMPD-指数复杂性的关键问题。

实际上,一旦算法的当前信念与已知信念收敛,就没有必要考虑导致当前信念的行为和观察。这最终会带来更好的可扩展性,允许机器人解决更复杂的导航问题。

“在动态重新计划期间,提议的方法使用(粗略)全局策略引导局部优化,”Kim说。“这意味着它可以做出非近视决策,不像其他具有有限后退视界的在线规划者。简而言之,这种方法可以适应环境中的动态变化,并且尽管存在未经模型化的扰动或错误,但仍可以稳健运行,同时使成本 - 全球意义上的有效计划。“

通过消除不必要的稳定步骤,Kim和他的同事设计的方法优于基于反馈的信息路线图(FIRM),这是一种用于解决POMDP的最先进技术。将来,信念空间中的这种动态重新规划方案可以在不同程度的不确定性下运行的机器人中实现更好的SLAP能力。

“我们现在计划将我们的方法应用于现实世界的问题,”金说。“一个可能的应用是火星直升机 - 火星车导航和协调行星探测的原型,由JPL的Ali-akbar Agha-mohammadi博士领导的一个项目。飞越地形的直升机可以提供粗略的地图,以便制定一个粗略的全球政策可以在离线阶段获得。随后,流动站将在在线阶段动态重新计划,以完成安全且具有成本效益的导航任务。“


免责声明:本文由用户上传,如有侵权请联系删除!

最新文章

精彩推荐

图文推荐

点击排行

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ   备案号:

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。

邮箱:toplearningteam#gmail.com (请将#换成@)