※ [本文转录自 C_Chat 看板 #1bZKg9iU ]
作者: s78513221 (月亮兔) 看板: C_Chat
标题: [闲聊] AutoVT 一个看Vtuber Live简便翻译的小
时间: Thu Dec 28 18:14:31 2023
日文N87路过,看V许久都是看人烤熟肉
很多只烤大箱,中小箱或新人初配信就很少烤肉人,挺可惜
然后看一些游戏生放送也是听都听不懂,哈哈哈
自己完全无python开发经验,靠GPT4搓了这样一个小工具
目的不是要100%看懂,而是至少知道人家大概在说啥就过得去
对直播流不算熟,所以每10秒一次的切片可能会漏切
主要是用了最近很红的Google Gemini Pro API,免费又比GPT快
翻译模型的部分用faster-whisper,显卡大概4G可行
Github 项目 (欢迎自己Fork改,顺手给点星星吧)
https://github.com/Arcelibs/AutoVT
基础版本
https://github.com/Arcelibs/AutoVT/releases/tag/stable-v1.0.1
使用族群取向
日本Vtuber
建议是用于杂谈,唱歌跟玩游戏不太推荐用,声音要清楚一点的
如果是哈洽马 三毛猫之类的不太适合,会辨识不太出来
测试范例 :
绯月 ゆい / Hizuki Yui 刚刚5点的杂谈
https://i.imgur.com/3plmOCd.png
台湾Vtuber
不太建议用在台V,用中文翻译中文.....?
英文或者外文Vtubuer
考虑到语言模型中翻译英文的准确度较好,可以接受
测试范例 :
Hana Macchia Ch (彩虹社印尼一期) 杂谈
https://i.imgur.com/ODwp6GQ.png
备注 :
常常出现 KeyError: 'candidates' not found in response. 无法翻译XX
目前可知的原因是因为传送的词语中带有性暗示/暴力等禁止词汇
被Google Gemini Pro API挡下,目前尝试在加入DeepL翻译当备案