这个技术领域非常复杂,要把人的抽象语言转换成电脑看的0和1,是有一定难度的,单纯使用软件是不太能够辨识出文字语言,所以要透过 Google机器学习算法等方式达到目标,很难不透过网络等这些平台进行辨识。 如果真的有这类单机软件(这里的单机是指不需要透过网络),直接拿影片档案进行转换,那么这个软件也会因为机器学习算法等的关系非常肥大(因为一定会需要机器学习算法此技术才可),就不会是小软件了。win10 的部分没很明确指出是否需要网络,这部分可自行测试,若需要的话可能是透过bing辨识的。若是真的要单机且不透过网络,有个方式是土法炼钢的概念,那就是把声音真的放出来再利用语音输入法(win10内建或其他需要网络的)、ViaVoice等进行辨识,辨识效果也是很有限,可能比youtube的还差。若是语音输入法是否可为同一电脑设备下进行放音及语音辨识就要自行测试了,理论上应该是可以,但是影片播放部分可能需要让它在背景下执行。类似这篇提到的操作方式
https://www.youtube.com/watch?v=ePJoZ76Z61c针对最重要的语音辨识这项目做说明,看不太了解那就请直接忽视了,谢谢。