[问题] 有关语音辨识的问题

楼主: oe725 ( )   2018-12-04 00:39:19
不确定这个问题是否可以在此版发问, 如果有其他更合适的版, 再请指正, 谢谢
最近在做语音辨识的research, 并对同事做了一些技术分享
当下被问到了一个问题, 我发现这部分我还真的不知道
我的问题如下, 以现今的语音辨识APP, 如apple的siri
Q1.
当我们输入唤醒词 "Hey siri" 或者其他内建的语音命令时
它的语音辨识机制应该是在手机(local)端做掉, 也可以说是离线处理的部分
而这边所谓的语音辨识机制, 也就是先将时域讯号透过傅立叶转成频域讯号, 然后经过特
征提取, 再做声学辨识?
还是local端是采用其他较快速的辨识方式?
Q2.
比较复杂的声学/语意分析, 理论上都要上传到云端做
此时上传的data是原始的语音讯号? 还是会先做一些前处理, 比如降噪/转频域讯号...等

Links booklink

Contact Us: admin [ a t ] ucptt.com