楼主:
unlucky (è¬ç¥žå»Ÿé–€å£å«åŒ–åder)
2026-05-14 23:20:40因为我的需求很不适合在电虾版问,
也会夹杂很多R18 二次元的疑问,
我就跑来这里问众神了.
我想要利用Ai协助的目的以其相关问题如下
……
1. R18 内容几乎是不被主流线上ai服务允许的
当然也可以把需要ai的环节
拆成R18和健全的部分
但那还是要弯弯绕绕 拆解步骤
2. 音声翻译 有附原文台本
没人翻译或不开放翻译的作品
3. 音声翻译 没有附原文台本
只能靠音档转文字 再翻译
这是我最主要的目的
我在ai发问
回答是
本地LLM
3060/4060 至少12gb显存
内存32gb
硬盘用m.2比较快
模型越大越好 预算很有限
我想确认假如我弄到5070ti 16gb
本地跑未经审查的模型 可不可行?
出来的结果是堪用?还是连堪用都不行?
如果堪用都做不到
我就认命不浪费心力玩这个了
4. 我可能对色图生图有一点兴趣
但这是顺便玩的
更大的可能是我光是玩机翻就消耗很多心力
毕竟工具在怎好用 也要学要用
非正事的需求 我对自己的意志力没太对信心
不是花钱买硬件就没事
我应该不会玩R18 文字创作 聊天
图片仅限于单图
根据常识 动画类消耗的算力更恐怖
所以我一开始就放掉了
真要有兴趣是三次元的
不在本版讨论范围
问题开头我有提到
线上服务基本上r18用途限制很多
我也认为不是所有人都有条件去玩本地ai
你们有没有什么拆解步骤
局部利用既有线上ai
完成自己在二次元R18需求的例子?
我能说的只有
DeepL线上翻译
Google网页翻译能做到的事已经很多
DLsite的简介基本上也能理解5成的文意
就是音声作品里面如果台本是pdf档案
是可以动手复制 很麻烦就是了
三次元的神人
用Google 智慧镜头截图
只要截图没有涉及器官和色色行为
背景又有足够多的讯息
例如截图不要把棒子截进去
选择敏感点在边缘的画面
就能找到影片番号的来源
二次元的本子搞不好也能这样做
只是我很久没看二次元本子了.
问题问题
听说有人走苹果电脑路线
也是可以玩ai?稳妥吗?
还是规规矩矩N卡就好?
作者:
gtfour (朱兆兰)
2026-05-15 00:00:00能用色图生图 去pixai就很简单好用了 我画好一堆图都还没空一一下载整理分类 是说pixai的生成图片有什么快速跳到以前画好的图的方法吗?还是只能慢慢往下拉等它读取 搜寻功能我也搞不懂要怎么使用才会直接跳到我要找的日期
作者:
Armour13 (鎧甲)
2026-05-15 00:20:00只跑翻译5070ti就够了,翻译没有那么吃资源。 生图的话没有要很高清的,5070TI 一分钟也能跑一张吧你主要的问题是音档转文字,音声很难转的精准....跑日文作品翻译的话,本地部属Sakura模型,去机翻轻小说,把文本扔上去跑本地最简单
音声很简单,语音辨识whisper模型就能对八成了,而且线上服务没挡这个,本地有张1060就能跑个tiny吧,新显卡直接跑large turbo版本,转出srt之后丢个google翻译。生图可以爬aI_art板,种类太多了很难一次讲清楚
现在Deepseek基本无甲,whisper后直接api翻译就好本地翻译Gemma 4 31b效果好,但q8要48gb vramWhisperjav 可以试试看,github 本地用whisper加上qwen两段式音转文提高识别率后用deepseek理解上下文并翻译涩图二次元的话16gb vram够用,目前主流是anima跟IL。你要三次元还有klein 9b,但最好是24gb vram以上才能爽用全部模型例如qwen image。要影片则24gb vram外最好至少64GB ram
作者:
Tosca (hi)
2026-05-15 09:07:00三次元其实IL和qwen image edit就够了
作者:
cmi5288 (目指せ!大魔法使い)
2026-05-15 11:03:00anime-whisper有针对喘息等微调,18+感觉有比较准现在8G左右LLM翻译已经很不错了,转译有误也会修正后翻译
作者:
Srwx (Srwx)
2026-05-15 13:27:00纯翻译不太会挡 甚至直接丢R18音源要生出文本也可以
本地LLM能不能跑要看模型大小我的4060 8GB可以顺跑的等级在7b左右,但模型要量化12b虽然还是能跑,但就算量化还是很勉强生图用的SDXL模型也是要量化过的才不会out of memory文字生成的品质我就不太清楚了,以前只试过翻译
Sdxl bf16才6gb多而已 除非你是做upscaling没开tiled decode 在建议分辨率(1-1.5mp)下文生图8g vram是足够的
LLM本质看显存跟模型 有多大用多大 效果也递增真的要用本地的话 最简单的方案真的是mac
作者:
guogu 2026-05-15 15:43:00翻译还是越大越好 虽然很多人说单机的也够用但是我用openrouter试各家的大模型翻译亦有好坏那种7B 1xB之类的还是翻得不太好 就是能看懂那样
5070ti能让你做到的还是很有限 不论llm/生图/lora等
作者:
yeeouo (林翔)
2026-05-16 01:08:00vram越大越好 没有够用一说 消费级显卡离资料中心遇到scaling law出现边际效应超级远 导致开源小模型参数规模变大品质都是大幅提升
作者:
Tosca (hi)
2026-05-16 09:11:005070ti生图应该是绰绰有余了啦 我mac mini都很够用了
楼主:
unlucky (è¬ç¥žå»Ÿé–€å£å«åŒ–åder)
2026-05-16 09:12:00Mac有什么优缺?或者说你们是本来有Mac发现顺便能玩ai就试试看片知道Mac的架构似乎是同样容量cp值最高但生态有没windows+N卡主流还丰富我以前帮人转资料过 Mac外接硬盘格式不太一样?自身容量又很小 不接nas的话很头痛?我是很赌烂win11了 但收藏整理工具和大量资料和win绑定Mac mini比5070ti便宜Pro 也不错了 24gb统一内存
作者:
Porops (猪排)
2026-05-16 13:00:00实际用过本地AI翻译就知道了,之所以规模越大品质提升是因为大部分的通用模型都要支援多模态,要能够应对你所有问题翻译AI不用考虑这些,上面都是专精日翻中ACG,可以和你保证你找30B的本地模型绝对比不上这些14B甚至7B的效果个人都在自己拿来持续翻译上千万文字的网络小说,差距实在很明显
欸楼上我有不一样的观点,现在Gemma 31b 这种多模态看图再翻译会比纯文字模型好所以要看应用场景,漫画类的用多模态模型翻译质量已经可以很通顺又符合画面剧情了
作者:
Porops (猪排)
2026-05-17 01:19:00我的应用场景自然是翻译AI阿,你要整个多模态AI自然又不一样比较了,那当然和我讲的是完全两回事
楼主:
unlucky (è¬ç¥žå»Ÿé–€å£å«åŒ–åder)
2026-05-17 20:13:00我图片类的全放掉了 真要玩就专心台本翻译和声音转文字