首页 > 要闻 > > 正文
2019-11-07 15:51:33

艾伦研究所的语义学者现在搜索1.75亿篇学术论文

导读 一些研究表明,每年以英语发表的科学论文数量超过300万,每天达数千篇。也许不足为奇,据估计,除了作者(或合著者)和出版期刊的编辑以外,

一些研究表明,每年以英语发表的科学论文数量超过300万,每天达数千篇。也许不足为奇,据估计,除了作者(或合著者)和出版期刊的编辑以外,任何人都只能阅读其中一半的论文。

为了帮助筛选洪水,由已故微软联合创始人保罗·艾伦(Paul Allen)创立的研究机构艾伦人工智能研究所(Allen Institute forAI)在2015年发布了语义学者(Semantic Sc​​holar),这是一种结合了机器学习,自然语言处理和机器视觉的公共搜索引擎突出显示来自计算机科学和生物医学期刊论文的数据并确定它们之间的联系。迄今为止,已有超过200万用户采用语义学者来分析学术文献,从临床研究中的男性偏见到中国AI研究的加速发展等现象浮出水面。现在,艾伦研究所希望为接下来的数百万用户奠定语义基础。

语义学者之前总共涵盖了4000万篇研究论文,以及相关的博客文章,新闻报道,视频和其他资源。但从本周开始,它在所有科学领域(包括生物学,化学,地质学,材料科学和医学物理学等自然科学)的1.75亿篇论文的影响力已经增长了两倍以上;社会科学,包括艺术,商业,经济学,地理,历史,哲学,政治学,心理学和社会学;以及正规/跨学科的科学,例如计算机科学,工程学,环境科学和数学。据艾伦学院(Allen Institute)称,这一扩展使语义学者成为全球用于查找学术内容的最全面的搜索引擎。

艾伦研究所总经理道格·雷蒙德(Doen Raymond)说:“搜索引擎无法像现在使用搜索引擎那样来进行科学研究,就像现在使用它们来购物,寻找餐馆或查找新闻文章一样。”“成功的科学搜索必须利用AI来理解科学论文,然后使研究人员能够超越关键词来找到正确的信息。这就是我们与语义学者建立的。现在,我们正处在历史的关键时刻,每个科学家现在都可以轻松获得强大而免费的AI搜索引擎。”

作为背景,陆军退伍军人雷蒙德(Raymond)为亚马逊的Alexa平台和Google在亚太地区的搜索货币化部门制定了机器学习计划,并于2018年3月受聘领导语义学者项目。12月,艾伦研究所宣布它将与微软合作,将语义学者与后者的“学术图”相连接,这是一个异构图,其中包含科学出版物记录和引文关系以及作者,机构,期刊,会议和研究领域。

由于增加了Academic Graph记录,到2019年8月,Semantic Sc​​holar中收录的论文数量增加到1.73亿以上。它们还间接支持Supp AI的开发,Supp AI是语义Scholar之上的一个门户网站,使像维生素,矿物质,酶和激素确定了它们可能与之不利相互作用的产品或药物。

“所有的大学,当今的所有科学家都应该研究AI和深度学习可以促进研究和科学进步的多种方式,”艾伦研究所首席执行官Oren Etzioni说。“我们已经证明,语义学者不仅能够进行深入的语义搜索,而且还能够对任何科学领域的已发表研究进行广泛的研究,从临床研究中的男性偏见到性别均等,或缺乏性别均等。”

根据艾伦研究所(Allen Institute)的说法,语义学者现在每月有600万活跃用户。