首页 > 要闻 > > 正文
2021-07-04 08:39:27

互联网资讯:微软的Azure认知服务获得了新的语音样式

导读 互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天
互联网是高科技的产物,是历史发展、社会进步、人类智慧的结晶;是人类迄今所拥有的容量最大、内容最广、传递速度最快的信息中心。全球每天有四亿人使用互联网,上网人数占世界人口的百分之6.互联网为我们了解时事、学习知识、与人沟通、休闲娱乐等提供了便捷的条件,接下来这篇文章给大家说说互联网科技的一角。

微软公司今天向Azure Cognitive Services添加了新的“语音样式”,Azure Cognitive Services是其基于云的应用程序编程界面套件和软件开发套件,开发人员可使用它们来创建具有智能语音功能的应用程序。

新样式(新闻广播,客户服务和数字助理)旨在帮助开发人员定制其应用程序和服务的声音,以适应其品牌或独特场景。该公司补充说,声音可以发出自然的声音,并且与真实人类声音的语调和样式匹配。

微软在博客中说:“基于强大的基本模型,我们的神经TTS声音非常自然,可靠和富有表现力。” “通过转移学习,神经性TTS模型可以从不同的说话者那里学习不同的说话风格,从而使声音细腻。”

第一种声音是新闻广播,旨在反映我们与电视新闻记者的联系的“专业语气”,没有区域主义的痕迹。声音具有中性的发音,其中不会掉落任何字母的声音。

微软表示,其微信服务的微软听力文档中也提供了新闻播报的声音,该服务可以用Word,Excel和PowerPoint朗读文档。Bing移动应用程序中还为那些希望大声朗读每日新闻摘要的人提供了语音功能。

微软表示,客户服务风格的声音是为创建客户服务应用程序的开发人员提供的,具有“友好”和“参与”的音调。对于数字助理语音,它具有“有用”的音调,适用于中继天气预报或导航方向等任务。

微软还增加了新的“情感风格”,用于表达不同的情感以适应特定的环境。情感包括英语和巴西葡萄牙语的愉悦和同情心,以及为阅读散文和诗歌而优化的“抒情风格”,仅提供中文版本。

星座研究公司(Constellation Research Inc.)分析师Holger Mueller告诉SiliconANGLE,这种语音功能非常重要,因为语音是新的用户界面,可帮助人们摆脱阅读信息的需求。

穆勒说:“神经网络通过拾起休息时间,音调和语调,使这些传统的机器人和机械声音听起来更加自然。”

Azure认知服务可与Google LLC的WaveNet系统相媲美,该系统总共提供57种不同的语音样式,包括31种AI合成语音和24种标准语音。亚马逊网络服务公司还提供了一项名为Brand Voice的服务,该服务依赖于AI来创建自定义发言人,该发言人具有其文本到语音产品Amazon Polly提供的一系列语音和情感样式。