[问题] 辨识影片中人声起始时间

楼主: asid52714 (黑心人)   2019-05-17 09:42:29
请问版友,
若我有一只五分钟的mp4影片,
想要辨识影片中的人讲话时的起始时间。
例如:00:02 大家好
00:03 很高兴今天能够参与此次会议
并不需要辨识语音内容再转文字,
只要能抓到起始时间即可,
不知道有什么套件可以达成这个任务呢?
感谢阅读。
作者: sma1033 (死马)   2019-05-17 11:17:00
若你的影片包含了除了人声以外的声音,那这个问题就很难反之,若影片里的声音非常干净主要都是人声,那人工抽抽Feature,自己调一下应该就可以做个7.8成自动上字幕这种事情大家都想做,但是技术上还是存在瓶颈
作者: jiyu520 (不要鲫鱼我)   2019-05-17 11:46:00
Voice Activity Detection (VAD)

Links booklink

Contact Us: admin [ a t ] ucptt.com