您的位置: 首页 >科技 >

语言可以帮助人工智能适应新环境

2022-09-01 15:57:02 编辑:司徒珊淑 来源:
导读 在本周在预印服务器Arxiv.org上发表的一项新研究中,多伦多大学和致力于推进人工智能的独立非营利组织Vector Institute的科学家提出了婴儿...

在本周在预印服务器Arxiv.org上发表的一项新研究中,多伦多大学和致力于推进人工智能的独立非营利组织Vector Institute的科学家提出了婴儿人工智能,这是一个研究描述性文本是否有助于人工智能在动态环境中推广的平台。 它和几个基线模型都将很快在GitHub上提供。

机器学习中最强大的技术之一-强化学习,它需要通过奖励激励软件代理实现目标-也是最有缺陷的技术之一。 它的样本效率低下,这意味着它需要大量的计算周期来完成,并且没有额外的数据来覆盖变化,它很难适应与训练环境不同的环境。

理论上,通过结构化语言对任务的先验知识可以与强化学习相结合,以减轻其缺点,而婴儿人工智能是为了将这一理论付诸实践。 为此,该平台建立在现有的强化学习框架-宝贝A I-之上,以生成各种基于动态、彩色瓷砖的环境,以及详细描述其布局的文本。

婴儿人工智能的水平包括可以拾取和丢弃的物体;可以解锁和打开的门;以及代理必须承担的各种任务。 就像环境本身一样,任务是随机生成的,它们通过“婴儿语言”传达给代理,这是一种使用英语词汇子集的组合语言。

上述文本揭示了使用的瓷砖类型和每个瓷砖的颜色匹配。 由于颜色和瓷砖类型之间的配对是随机的,因此代理必须它的描述才能正确地导航地图。

在宝贝A I中,每个级别被划分为两种配置:培训和测试。 在训练配置中,代理暴露在级别中的所有瓷砖和颜色类型中,但是一些颜色类型对的组合被保留出来。 在测试配置中,启用所有颜色类型对,迫使代理使用语言接地将瓷砖的类型关联到颜色上。

本文描述了使用基线模型进行的几个实验,其中之一-注意力融合-使用所谓的注意机制将相关的文本嵌入(数学表示)分配给场景嵌入特征映射上的位置(一个将嵌入映射到特征空间的函数,或AI过程驻留的变量的维数)。 对于最困难的水平,这种注意力融合模型在最具挑战性的水平上比第二最佳模型高16.2%的测试成功率(5个步骤或动作后约60%),并且它使用较少的图像帧完成了该级别(约65比75)。


免责声明:本文由用户上传,如有侵权请联系删除!

2016-2022 All Rights Reserved.平安财经网.复制必究 联系QQ280 715 8082   备案号:闽ICP备19027007号-6

本站除标明“本站原创”外所有信息均转载自互联网 版权归原作者所有。