楼主:
kumahead (观测代号1095)
2026-02-04 17:18:55如题
为了追停止代理的小说
我做了个AI翻译工具
几周前去了趟日本玩
逛书店时赫然发现
国中开始追的小说还在更新
就是号称罗马数字教学,女主存在感越来越稀薄的,男主金次的奇妙冒险,<<绯弹的亚莉
亚>>
台湾尖端出版只到39,日本已经出到44了
寻思现在AI翻译水准已经不差了,也买得到日文电子书
心一横,就买了39~44的日文电子书,回来开发个翻译工具
最初的想法很简单
让AI对照39集的中日版本,建立角色、招式、专用术语的翻译字典
再让AI参考字典对40~44进行翻译即可
自然踩了许多坑
* 许多句子会翻译失败
* 翻译夹杂着注解&思考过程
* 新角色&招式因为不在字典里,翻译会不连贯
最后花了数天改成以下流程:
1. 对照39集中日两版建立字典
2. 让AI扫一遍新书,抓出容易翻译不一致的名词加入字典
3. 手动调整字典里新词汇的翻译
https://i.mopix.cc/KYvGbx.jpg
4. 让AI将日文新书翻译一遍
https://i.mopix.cc/NRK0zG.jpg
5. 用UI对照原文,人工检查翻译品质,辅以AI& Google 翻译逐句修正
https://i.mopix.cc/QUlgcE.jpg
6. 合成电子书译本
https://i.mopix.cc/QgDm2R.jpg
根据我自己的阅读&语文能力,从头完成一本轻小说的翻译要花大约5小时上下
运气差的话在第5步骤会发现重大人物名称翻译问题
得修改字典后退回第4步骤重新跑一遍
====以下有雷====
比方说40集退回幼童的拉斯普京娜
自称チナ
一开始不知道是人名翻成“支那”
AI的译文里就不断出现中国人
还有42、43出现的,贝瑞塔创办的NGO的特工
Giusto 5号 的代号是The Father
一开始以为是意大利黑手党,翻成父亲
实际上是圣职者,要翻作神父
最头痛的是44集的地雷女
自称、称呼他人、讲话内容到处都是奇怪的变体简称
金次 kinji > 金P kinpi
响 hibiki > 响P hibipi
割腕 arm cut > 阿母卡 amuka
由于44集主角在男公关俱乐部卧底
一堆酒都不写全名,都是简称
AI的翻译品质明显下降
====防雷结束====
总之,小说翻译看完了后
为了让这工具能多派上用场
又花了几天改成多语种的翻译工具,不再侷限于日翻中
兴许能成为小说推广工具?
发这边看看有没有出版社之类的有兴趣
或是有类似断更困扰的都可以留言或私我
作者:
XFarter (劈哩啪啦碰碰碰)
2026-02-04 17:23:00帮推 看起来是直接 call API?
作者: jackz (呦呵呵) 2026-02-04 17:25:00
AI就是断更救星
之前看别人有问过说还会继续出,结果出了1本又没下文
作者:
arrenwu (键盘的战鬼)
2026-02-04 17:26:00你能借到 DGX Spark也不容易啊XD 这台不便宜耶
作者:
sokayha (sokayha)
2026-02-04 17:26:00ai翻日文小说的对话应该是缺主词的问题最大 加上幻觉问题就变成连原文不在场的人都进来插话了
作者: sd2567 (starseed) 2026-02-04 17:26:00
你借得东西也不便宜啊
Ai再发展下去我看台湾出版社会完 进度慢又容易断尾
作者: sd2567 (starseed) 2026-02-04 17:27:00
出版社早就死得差不多了
作者: jackz (呦呵呵) 2026-02-04 17:27:00
小说用API真的很贵 漫画还好
作者:
junorn (威廉华勒斯)
2026-02-04 17:29:00那么大量的字不用本地LLM跑真的不便宜...是TranslateGemma吗?
作者:
sokayha (sokayha)
2026-02-04 17:29:00之前看地错新本有人丢ai翻的试看版 看了没几段满脑问号、自己对照完原文发现问题在哪后 就乖乖回去啃日文直到看完那两本了
作者:
junorn (威廉华勒斯)
2026-02-04 17:29:00阿推完文才看到用的模型,抱歉
作者:
arrenwu (键盘的战鬼)
2026-02-04 17:30:00DGX Spark 可以跑比 32B 强很多的模型吧长久地来说,看得懂日文当然是比较好的 因为日中转换总是避免地会因为语言结构不同而有失真的部分
作者:
XFarter (劈哩啪啦碰碰碰)
2026-02-04 17:31:00如果有 Ground truth + 文意表的话好像其实不太需要本地 LLM,用上下文窗口大一点的 LLM 含纠错的成本及效率,也许比直接架 Qwen 更好?
作者:
ElfFail (秘密)
2026-02-04 17:31:00这个有没有办法翻译一些日文游戏的文本呀,之前一直很想把梅露可物语的剧情补完但碍于没有翻译(
作者:
XFarter (劈哩啪啦碰碰碰)
2026-02-04 17:33:00就算用 4090 甚至以上 GPU 跑模型,VRAM & RAM 太低的话单次 Response 的速度也挺慢的吧 QQ
如果说个别帮小说建立关键字的数据库呢?不知道可不可行这样至少翻译专有名词的时候不会出错但如果数据库内容有来自不同出版社的小说的话,版权问题感觉会很麻烦就是
作者:
XFarter (劈哩啪啦碰碰碰)
2026-02-04 17:34:00@Elffail 你有办法把文字表吐出来就可以 如果是 RM 类型的游戏的话用 Mtool 甚至可以吐 json 的 Key value table
作者:
a37805 (ForeverSone)
2026-02-04 17:35:00我从五十音不会到基本可以正常速度读大概花了一年每天读日文4hr假日8hr以上 刚开始还要自己去买教材或是上网找教材来读 给想要自学的参考
作者:
ElfFail (秘密)
2026-02-04 17:35:00因为梅露可目前是已经有单机版本了,所以应该是能从里面找到文本档案 不过这又是一个要去问的知识了(
作者:
arcanite (不问岁月任风歌)
2026-02-04 17:35:00推
作者:
dnek (哪啊哪啊的合气道)
2026-02-04 17:37:00勇者
作者:
XFarter (劈哩啪啦碰碰碰)
2026-02-04 17:40:00像梅路可这种 Unity Engine 的话我记得好像也有现成的工具能汇出,比较知名的就 SakuraTranslator?但我没特别研究 大部分我有翻译需求的都是 RM 做的黄游...这些文本翻译的汇入汇出工具 Mtool 其实非常成熟
作者: NoLimination (啊啊啊啊) 2026-02-04 17:42:00
我的经验是一次一万字比较稳 变翻变制作专用辞典主词省略导致翻译搞错还是要自己校对一下
作者:
sokayha (sokayha)
2026-02-04 17:46:00看的都是acg相关的话 动画(听)->gal game(听+读)->なろう上的小说 这条路径学的会比较轻松且有动力就是了
Lunartanslator可以翻译一些unity的小黄游
作者:
sokayha (sokayha)
2026-02-04 17:47:00holo en、holo id他们会日文的也几乎都这样学来的
可以去看对岸sakura翻译相关的社群ai翻日文小说这块蛮成熟了不过问题还是跟你遇到的一样 躲不掉XD
作者:
PSP1234 (PSP1234)
2026-02-04 18:00:00我也是靠ai翻译追很多台版断尾的作品只是精准度还是不够高 有些地方还是要配合原文
话说古板在问AI有没有杀手级应用...我也只能笑笑w
作者:
r30307 (RPG)
2026-02-04 18:03:00可以问问GPT如何把AI翻译的算法进一步优化(
作者:
akway (生活就是要快乐)
2026-02-04 18:06:00AI好用+1
作者: bag0831 (bag) 2026-02-04 18:10:00
推,每次都有键盘语言家叫人学日文,真的躁==
作者:
avans (阿纬)
2026-02-04 18:15:00推设计与分享
想自己看 还要花5hr==这么大量 除非你钱很多 用api跑 根本像烧纸钱一样
作者: BruceChang (=A5e) 2026-02-04 18:36:00
用api应该品质提升会减少那个校稿时间
作者:
Armour13 (鎧甲)
2026-02-04 18:42:00校正真的很费时,如果没有要分享给别人看,我都sakura翻一翻自己爽就好了不过亚莉亚这种长青树,去对岸社群找找可能有热心的小精灵用Ai翻好跟校正好的
作者: haseyo25 2026-02-04 18:51:00
应该说原文不是不能啃但是很烧脑没办法放松看
作者:
bitcch (必可取)
2026-02-04 19:26:00个人经验翻译前的prompt也很重要 可参考些开源工具的写法
作者: rnmrn (o0O0o) 2026-02-04 20:13:00
好厉害 推推
作者:
NovaWolf (左手红中右手白板)
2026-02-04 20:36:00我是有买GPT的API额度啦 换算流量费没很贵 跟Sakura一起使用当两边对照喔对了 我是用Luna Translator
作者: deolinwind (某F) 2026-02-04 20:59:00
github找sakurallm