首页 > 生活 > > 正文
2019-11-07 15:45:10

语音识别技术不是穷人读者的解决方案

导读 人工智能能否成为无法阅读的人(功能性文盲)或根本无法阅读的人(完全文盲)的解决方案?心理语言学家认为,语音技术永远不应取代学习如何阅读

人工智能能否成为无法阅读的人(功能性文盲)或根本无法阅读的人(完全文盲)的解决方案?心理语言学家认为,语音技术永远不应取代学习如何阅读。研究人员认为,识字能够更好地理解言语,因为优秀的读者善于预测词汇。

即使在今天,大约五分之一的人被认为是“低识字”或文盲;他们无法阅读或撰写有关日常生活的简单陈述。识字率低可能是由于没有或很少阅读练习或阅读障碍,如阅读障碍。对于识字率较低的发展中国家来说,语音识别一直被谷歌等公司称为解决方案,称其为“技术的下一个重大飞跃”。但语音技术真的是低识字率的解决方案吗?

Falk Huettig和Martin Pickering认为事实并非如此。在“认知科学趋势”中的一篇观点文章中,心理语言学家认为依靠语音技术可能会适得其反,因为识字在阅读之后具有至关重要的好处。“考虑阅读语言的优势是非常相关和及时的,特别是因为人们往往阅读的方式比以往更少,而且方式不同,”Falk Huettig说。“例如,当代社交媒体的写作和阅读习惯与传统印刷媒体截然不同。人们过去从小说,报纸,公告,甚至食谱等书面来源获取的信息越来越多地来自YouTube视频,播客或有声读物。“

这不一定是坏事,因为阅读的一些一般好处也可以通过听有声读物获得。由于有声读物还提供“书籍语言”,听取它们会带来一些类似的好处 - 例如更大的词汇量,增加的世界知识和更大的短期(“工作”)记忆,这对于跟踪记录非常重要信息和多个实体的几个句子,段落或甚至页面。

但根据Huettig和Pickering的说法,阅读本身 - 阅读的实际物理行为 - 对于培养预测即将到来的单词的技能至关重要,这些单词从阅读转向理解口语。阅读训练语言预测系统,尽管即使是非常年幼的孩子 - 无法阅读 - 也可以预测句子的去向。当2岁的孩子听到“男孩吃了一块大蛋糕”时,他们在听到“吃”之前已经看过可食用的东西(即蛋糕),但在听到“蛋糕”之前。预测即将发布的信息非常有用,因为它可以减少处理负担并释放有限的大脑资源。而且至关重要的是,熟练的读者会更好地预测。

最狂热的读者中的儿童每年会遇到400多万字,而很少读的儿童只会遇到大约50,000字。因此,优秀的读者可以更深入地理解单词的含义,并建立大型单词网络,并在它们之间建立强大的联系 - 这有助于他们预测即将到来的单词。由于贫穷的读者在他们的头脑中具有较小的词汇量和较弱的词语表示(即对一个词的声音和意义的回忆),词之间的预测关系也较弱(例如,'读取......'的预测通常是然后是'书')。

有文化的头脑

由于阅读是自我调节的,因此有强烈的动机来预测即将到来的单词,因为这会加快阅读速度,这通常比听力快得多。熟练的读者倾向于一目了然地(同时用他们的眼睛注视多个字母)并且用眼睛运动来优化阅读过程。印刷文本(即使偶尔会改变字体和单词大小)也比会话语言更加规律,会话语言充满了不流畅,不完整的单词发音和语音错误。书面文本的这种规律性有助于读者形成单词之间的预测关系,然后,通过扩展,还可以用于在听取语音时更好地预测单词。

对于很久以前学会阅读的人来说很难想象,但即使是“词”的概念也是有文化思想的发明;如果你是一个只听过一连串语音的文盲,你很难掌握。例如,当尚未学会阅读的文盲或儿童被要求重复口语句子的最后一个单词时,他们倾向于重复整个句子。相比之下,单词在书面语言中显得突出,通常由白色空间分隔。书面形式使单词更加突出和精确:读者更加意识到单词在语言中是稳定的单位。将书面形式的单词存储在记忆中也有助于使口语单词形式更加突出,以便在预测即将发表的语音时更快地访问。然后再次,

“我们的论点提供了另一个理由,为什么应该进一步努力教育发展中国家的数亿文盲和世界各地的功能性文盲如何阅读(或更好地阅读)以及为什么要关注人工智能语音识别和语音作者认为,帮助克服与识字相关的问题有其危险性。

“写作是一项古老的人类技术,我们不应该轻易放弃。即使在现代技术领域,教学如何阅读以及如何更好地阅读仍然非常重要,”Huettig总结道。