楼主:
ge99764 (戰艦級肥宅)
2018-07-20 07:28:28捐出你的声音! Mozilla开源语音资料专案Common Voice开始募集正体中文音档
iThome
https://tinyurl.com/yczfkd5w
Mozilla开源语音数据库专案Common Voice目前已收集超过900个小时的语音资料,其中以
英语居多,并已释出英文语音资料集的第一个版本供外界使用,6月开始该专案开始募集
德语、法语的语音资料,并在6月底开始募集正体中文语音资料。
文/苏文彬 | 2018-07-19发表
为加速语音辨识相关技术及应用的发展,Mozilla去年发起开源语音募集专案Common
Voice(同声计画),在6月底开始募集正体中文音档,鼓励民众献声,以协助正体中文语
音数据库的建立。
去年7月启动的Common Voice专案,目的是收集训练语音辨识所需的语音资料,根据
Mozilla统计,迄今已有超过200位开发者参与这项计画的软件开发,目前已募集112个国
家超过2.4万人贡献的声音,蒐集超过900个小时的语音资料,是全球仅次于磁带书
LibriSpeech数据库的全球第二大开源语音数据库,预估年底可望成为全球最大的开源语
音数据库。
Common Voice专案已有60种语言版本,但由于人手不足,现在已开始收集15种语言的语音
档,除了英文语音外,6月开始募集德语、法语、威尔斯语录音档,正体中文语音也在6月
底开始募集。
带领Common Voice专案的Mozilla开放创新部门数位策略师Michael Henretty表示,语音
辨识不仅要能辨识语言,还要能理解自然语言,由于辨识涉及深度学习,需要昂贵的运算
系统、大量的语音资料,目前的语音助理技术大多掌握在几家大厂手中,商业化的语音辨
识技术也忽略非主流语言的声音,Mozilla希望透过Common Voice收集不同国家、语言、
性别或年龄的声音建立一个全球最大的开源语音资料集,让语音辨识术能够民主化,也为
没有受过教育、视障者、儿童或老年人等弱势族群降低资讯存取的门槛。
目前该专案已募集超过900小时的音档,以英语音档最多,去年底至今年初Common Voice
已开放英语资料集下载,为方便外界使用,采用CC 0授权。至于非英语的其他语言,法语
及德语各有约50个小时音档,正体中文在6月底才刚开始募集,为亚洲地区第一个展开募
集的语言,现在已有36小时音档。
非英语的语言资料集目前尚未开放,Michael Henretty表示,英语的语音资料集在募集的
6个月后开放,至于正体中文的资料集何时会开放,目前还没有明确的时程。Common
Voice专案希望未来募集足够的语音资料后可以稳定的发布语音资料集的更新版本。
Common Voice专案的理想目标,是希望能够尽量收集到不同国家、不同语言,不同性别、
年龄层的语音资料,如此才能让资料集发挥更大的效用,以该资料集打造的语音辨识技术
能够正确辨识语音。至于需要募集多少的语音资料,Michael Henretty认为如果能够募集
到1万个小时,相信能让运用Common Voice的开源语音资料集的语音辨识技术做到和
Google相近的水准。
专案收集到语音资料除了和Mycroft、Snips.AI、威尔斯的Bangor大学等新创或学校进行
语音相关技术的合作外,资料也会运用在Mozilla的语音辨识引擎“深度语音辨识”(
Project DeepSpeech)专案上。
有兴趣捐出自己声音的民众可以前往网站,iOS用户可以下载app利用手机录制音档,
Android用户则可以手机浏览器。如下图所示,民众进入Common Voice募集网页后,可点
选“说话”,依照指引对着麦克风唸出萤幕上秀出的中文字句,或是点选“聆听”协助校
正,系统会秀出一个中文句子并唸出声音,使用者协助确认唸出的语音是否和句子相符即
可。
网站连结:
https://voice.mozilla.org/zh-TW/speak