9月,网易有道词典官宣了代言人王源,也上线了王源同款“明星语音”功能,10月假期刚过,这支明星语音背后的团队又低调地拿下了一个国际语音大奖,即Interspeech2020口音英语语音识别挑战赛。
Interspeech是由国际语音通信协会ISCA组织的语音研究领域的顶级会议之一,今年的赛事吸引了来自全球各地的语音技术研究者,竞赛指导委员会来自上海交大、南洋理工和美国约翰霍普金斯大学等高校和机构。有道人工智能产品部的语音团队在这届竞赛中获得二等奖。
目前,有道在AI领域的布局主要分为,自然语言处理(NLP)、图像识别(OCR)和语音识别与合成,其中自然语言处理和图像识别都是有道的强势技术领域,为有道在互联网产品端做了大量的技术赋能。
语音团队是成立时间相对最短,且团队非常年轻,主要负责这次竞赛项目两位团队成员都是90后,其中一位是95后。
近年,有道在AI领域斩获颇多,除了不断更新迭代的有道词典笔等硬件产品,有道精品课等在线教育业务上,也应用了语音识别、口语打分、AI作文批改等智能技术。
带着技术基因发展的网易有道,在语音、翻译等领域已有技术底蕴,技术也推动了有道的内容布局。
以翻译技术起家的有道,在AI时代攻坚神经网络翻译技术(NMT),目前其NMT准确度已达到国际领先水平;AI作文批改曾入选机器之心2020人工智能金炼奖;作为王牌技术之一的OCR识别技术,已经能支持26种主流语言文字,是目前国内识别语言最多的OCR识别引擎。
当有道词典笔逐渐成为学习场景的“三大件”之一,语音识别技术更加精进。9月推出的王源“明星语音”功能背后,则是有道自主研发的定制语音合成(Text To Speech,简称TTS)技术实力。
(有道语音团队合影)
孙艳庆谈及开发“明星语音”功能时,非常感概团队的不懈合作。面对这一群90后、95后同学,他们有的是猫奴,有的沉迷俄国文学,有的向往技术追星,孙艳庆的团队要求只有,活泼且脚踏实地。
“尽管我们会参加比赛去测试我们的技术成熟度,但整个有道AI团队更注重给用户更极致的体验,希望把技术尽快触达到用户手里,获得好的用户体验和反馈。”
本文属于原创文章,如若转载,请注明来源:王源明星语音功能背后的网易有道团队 又拿下国际大奖 //robot.zol.com.cn/755/7550119.html