首页 > 信息互动 > > 正文
2021-07-05 08:19:12

互联网资讯:Facebook开源嵌入式AI工具来推进机器人导航

导读 互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天
互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天有四亿人使用互联网,上网人数占世界人口的百分之6.互联网为我们了解时事、学习知识、与人沟通、休闲娱乐等提供了便捷的条件,接下来这篇文章给大家说说互联网科技的一角。

Facebook Inc.今天推出了一个新的研究数据集和一个开源开发模块,以创建功能更强大的“体现”人工智能模型。

嵌入式AI是一个术语,通常是指安装在机器人上的机器学习模型。这些神经网络直接与其环境互动,并且通常还需要具有导航该环境的能力,例如在为在货架之间运送包裹而建造的仓库机器人的情况下。近年来,Facebook研究人员在嵌入式AI导航领域做出了 重大贡献。

该公司今天开源的研究数据集SoundSpaces旨在通过允许机器人分析环境声音来帮助机器人更有效地找到自己的出路。音频对于导航很有用,因为它可以将上下文添加到机器人使用其相机收集的视觉数据中。例如,如果用户要求假想的机器人家庭助理取回正在响铃的智能手机,则将声音追踪到其来源可能比目视检查设备可能位于的每个房间要快得多。

SoundSpaces提供了音频文件的集合,AI开发人员可以使用它们来在仿真中训练声音感知的AI模型。这些音频文件不是简单的录音,而是Facebook所描述的“几何声学模拟”。这些模拟信息包括以下信息:波浪如何从墙等表面反射出来;它们如何与不同的材料相互作用;以及其他数据,开发人员可以使用这些数据来创建逼真的模拟来训练AI模型。

Facebook研究科学家Kristen Grauman和Dhruv Batra今天在博客中写道:“据我们所知,这是训练能够看到和听到以映射新型环境并定位发声目标的深度强化学习代理的首次尝试。” “通过这种方法,我们获得了比单模态同行更快的培训和更高的导航精度。”

Facebook今天还表示,已经开源了一个名为“语义地图网”的工具。它是开发人员可以用来为模型提供某种空间内存以改善导航的软件模块。

当由AI驱动的机器人进入新环境(例如新房间)时,它们通常会创建地图,以使将来前往该位置的旅程更加轻松。这些未来行程的有效性在很大程度上取决于机器人地图的质量。

Facebook的语义MapNet模块承诺通过使其更容易捕获环境中的小且难以看到的物体来改善地图质量,同时还使AI模型能够更准确地记住较大物体的位置。结果是更准确的导航。

Grauman和Batra写道:“语义Mapnet为预测特定对象(例如沙发或厨房水池)在其创建的像素级自上而下的地图上的位置设置了新的技术水平。” “它的性能优于均值-IoU的先前方法和基线,均值-IoU是用于预测和基本事实之间重叠的度量标准。”