[新闻] RetroArch万用模拟器语音朗读功能再进化

楼主: protect6090 (山茶花)   2019-08-16 06:52:11
RetroArch万用模拟器语音朗读功能再进化,自动翻译呼之欲出
https://www.techbang.com/posts/72128-retroarch-universal-emulator-voice-reading-reevolves-auto-translate-call-out
先前笔者曾介绍过RetroArch将透过光学文字系统(OCR)自动辨识游戏字幕,并透过语音引擎将文字唸出来的功能,别急,这个功能还在开发中,不过从进度更新中,我们可以看到朗读的流畅度明显提升,而且官方也表示将会整合翻译功能,协助玩家跨越语言隔阂。
OCR辨识立大功
OCR由Optical Character Recognition缩写而来,中文翻译为光学字符辨识,指的是将图像中的字辨识成电脑的文字档,举例来说用扫瞄仪扫瞄文件后,再将文件图档转换成文字档,就是利用这种技术。
而RetroArch的作法则是在模拟游戏的过程中,辨识画面中出现的字,并将这些字以图档的型式送到辨识系统,再转换成文字档。有了文字档之后,我们就能轻松处理这些游戏中出现的字,比方将它们送到语音合成系统、翻译系统,将文字朗读出来或翻译成其他语言。
先前RetroArch开发团队所展示的开发进度,需要在游戏执行过程中不断暂停,等待系统完成辨识,才会朗读文字并继续游戏,这样会大幅影响游戏的流畅度。而在这次的进度更新中,可以看到辨识的效率大幅提升,虽然语音会比字幕晚几秒出现,没办法达到即时朗读的理想目标,但已经不需暂停游戏,能让玩家在不受干扰的情况下享受游戏内容。
后,下一步应该就是剑指翻译功能,在这次的更新中,RetroArch开发团队证实了这个猜测。
开发团队表示正在研究将VGTranslate轻量级翻译服务器导入RetroArch,玩家可以在Windows或Linux电脑上架设服务器,并透过网络将RetroArch撷取的文字资料送至服务器,以达到翻译游戏内文字的效果。
这样做的好处是可以将翻译过程的运算需求与数据库,从执行RetroArch的装置转移到另1台电脑,如此一来即便是Raspberry Pi等效能相对贫弱的单板电脑,也能享受翻译功能。
然而开发团队也提到OCR的困难之处,比方OCR引擎难以辨识游戏标题画面中的标志(通常都是图像化的特殊字体),而且如果日文游戏的文字框采用半透明设计的话,在辨识日文字的时候就容易受到背景图像干扰,产业准确度不理想的问题。
从目前的开发进度来看,这个功能已经可以在许多游戏中正常运作,但有些游戏的效果则受文字显示方式影响而比较不理想。即便如此,开发团对仍表示会持续改善,并提升OCR、翻译功能的相容性。
太屌啦这!!!!!!
作者: randy061 (061)   2019-08-25 17:32:00
谢谢分享 这真的太棒了!
作者: schoole (光明之子)   2019-08-26 15:24:00
库喔!

Links booklink

Contact Us: admin [ a t ] ucptt.com