首页 > 科技 > > 正文
2021-07-04 09:12:21

互联网资讯:AWSKendra清理杂乱的数据孤岛并发现隐藏的企业信息资源

导读 互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天
互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天有四亿人使用互联网,上网人数占世界人口的百分之6.互联网为我们了解时事、学习知识、与人沟通、休闲娱乐等提供了便捷的条件,接下来这篇文章给大家说说互联网科技的一角。

机器学习不断使搜索引擎变得更智能,在消费者世界中,快速的搜索和准确的结果是理所当然的。但这是一个不同的世界,搜索似乎停留在1990年代。内部数据搜索受到数据孤岛和遗留应用程序的阻碍,要求用户输入非常具体的搜索词并以长长的链接列表形式接收响应。

Amazon Kendra有望打破这些孤岛壁垒,并将企业搜索带入智能时代。

“当我们谈论打破数据孤岛时;Swami Sivasubramanian说( [Kendra]负责取回数据并将其放置在中央位置,了解这些文档背后的上下文,然后也可以使用简单的普通自然语言快速回答客户的查询。” ),Amazon AI副总裁兼Amazon Web Services Inc.机器学习服务总经理。

作为AWS Summit Online 活动的一部分,Sivasubramanian与SiliconANGLE Media的实时流媒体工作室CUBE的主持人John Furrier进行了交谈。他们讨论了亚马逊新的Kendra机器学习支持的搜索服务和增强型人工智能。(*以下披露。)

清理内部数据混乱

创建Kendra的关键前提是访问许多企业中存在的数据混乱情况。Sivasubramanian认为,外部世界的消费者网络具有定义明确的结构,页面可以轻松链接,而企业内部的内部世界则“非常混乱”。

“客户想要的是一个系统,该系统知道如何实际从各种数据孤岛中提取数据,仍然了解它们背​​后的访问控制,并在搜索中实施它们,然后了解其背后的真实数据,而不仅仅是做简单的关键字搜索。”他说。“当您搜索TB或数百TB的内部文档时…抛出指向这些文档的数百个链接是不够的。”

Kendra的智能意味着,除了从消费者网络中发现和导航的概念外,该服务还可以了解数据库中的细微差别和配置方案。这意味着Kendra能够查明包含该信息的确切文档,然后使用其自然语言处理能力返回特定的答案。

Sivasubramanian说:“您不仅发现了相关的信息,而且还获得了非常准确的……某些问题的精确答案。”

Sivasubramania认为,实施Kendra很简单。“如果您实际上是如何设置诸如Kendra搜索集群之类的东西,那么就像从AWS上的管理控制台一样简单,您就可以将Kendra指向AWS数据服务,例如Amazon S3或SharePoint或Salesforce,以及他解释说,其他各种数据都说“这些就是我要索引的数据”。

然后,Kendra将自动提取所需的数据并使用深度学习模型对其进行索引。这使用户可以使用自然语言进行查询,而不必担心数据位于何处。

“ Kendra处理诸如访问控制之类的事情,并且在引擎盖下使用经过微调的机器学习算法来理解自然语言查询的上下文并返回最相关的[响应],” Sivasubramanian说。

Kendra省钱并加快研发速度

该服务已被包括3M Co.在内的许多AWS客户所使用,该公司正在使用Kendra支持材料科学研究和开发。

“ 3M试图做的是人员协作;提供遍及全球的搜索以搜索其实验档案等。他们很难做到这一点,这是肯德拉启用新哨所的领域之一。”西瓦苏布拉曼尼安说。

3M的全球研究团队现在可以访问公司档案中所有过去和现在的信息。这样可以加快产品开发速度,同时降低成本和上市时间。

一个重要的用例是与有关的医学研究。据Sivasubramanian的语义学者团队在艾伦研究所AI最近开辟了科学研究的仓库被称为开放研究数据集使用肯德拉被索引。Sivasubramanian解释说,该项目被称为CORD-19,它使科学家,经济学和技术人员能够“在科学文献的海洋中迅速找到信息”。

在企业界,Kendra可用于客户服务,以比传统搜索引擎更快的速度返回消费者问题的准确答案。Sivasubramanian引用了一家领先的税务咨询和保险公司的用例,他说:“他们使用Kendra来快速搜索产品手册等,并且他们可以获得最快10倍的答案。Kendra就是这种影响。”