楼主:
fffffff4 (使用者在线上)
2019-01-10 21:21:01※ 引述《gj942l41l4 (米食主义者)》之铭言:
: As title
: 原本以为google小姐只能念单字
: 这样很简单
: 就把每个字录起来就好
: 二十年前电子辞典就做到了
: 另人吃惊的是google小姐可以念句子
: 但是她怎么知道我要她念什么句子?
: 人类造句无穷多 uncountable
: 不像单字一样有穷有尽
: google小姐到底是怎么办到的
: google小姐总不可能把人类所有用句都录起来吧!
: Why???
: 难道google聘了一个人坐在网络另一端
: 看着我输入的句子然后念出来吗!
: 那google有缺google先生吗
: 我也想当google员工求内推~~
: 有没有八卦啊?
语音合成主要有两种方法
第一种是unit selection synthesis
请人类配音员录下上百上千上万种音
每个样本都切割成短音,可能只有几十毫秒、半个phoneme那么长。
全部存在数据库,电脑要就拿来合成。
siri就是这种
第二种是parameter synthesis
每个音都有独特的声纹,每种声纹都有自己的参数,电脑用参数就可以合成了。但当然就
不如第一种那么逼真。
大概是这样。