首页 > 要闻 > > 正文
2021-03-14 09:49:52

Google Lens通过重新设计 OCR更新庆祝其一周年

导读 一年来,Google Lens一直在改变智能手机用户使用其设备上的相机的方式。通过深度机器学习来分析通过设备的相机收集的图像,该应用程序

一年来,Google Lens一直在改变智能手机用户使用其设备上的相机的方式。通过深度机器学习来分析通过设备的相机收集的图像,该应用程序可以执行以下任务,例如在您拍摄封面照片时告诉您一本书,通过查看商店或位置的图片来确定商店或位置,或者连接到wifi摄像机指向显示登录数据的标签时的网络。

在新的博客文章中,Google提供了有关上周启动的Google Lens重新设计的更多详细信息。一个主要功能是能够根据视觉信息而不是文本信息进行搜索。因此,也许您看到一只可爱的狗,并且想知道它是什么品种。使用传统的基于文本的搜索,您将不得不查找单个品种并比较图像,或者寻找完整的犬种清单,并希望找到合适的犬种。使用Google镜头,您可以使用相机拍摄狗的图像,并让Google从该图像中识别出该犬种。

同样,您也可以从图像中搜索以标识相似样式的项目。如果你看到你喜欢的,而你出门在外的服装,或像一个美丽的灯家居装饰项目,那么你可以捕捉与镜头图像,它会搜索不仅对原来的项目,同时也为类似的项目是具有相同的风格。该过程通过一种机器学习算法进行工作,该算法在线浏览数亿张图像以提取特定物品的显着视觉特征,从而使Lens可以仅从图像中识别物品和其他类似物品。

Lens面临的一项挑战是使其与文本一起使用。教相机了解文本需要一种称为光学字符识别(OCR)的功能,即使镜头使用不同的字体,角度,非最佳的颜色或光线,镜头也可以识别这些字符。使用镜头中更新的OCR,您现在可以使用相机将物理文档中的文本复制并粘贴到手机上。

谷歌押注,随着智能手机获得更好的相机,我们将越来越多地将它们不仅用作数字设备,而且还将用于与现实世界的互动。