Re: [闲聊] 皇城还在吵AI喔

楼主: Satoman (沙陀曼)   2026-04-20 14:37:19
※ 引述 《jeffreyseh (jeffreyseh)》 之铭言:
: 纯画面的话现在开源的能做的还OK了
:  
: 但是配音跟音效都超奇怪
:  
: 有没有董哥说一下一两年内有机会ㄇ
:  
: 太晚我ㄐㄐ可能跟不上了
配音主要是两个问题
目前主流的对嘴的模型fantasytalking
就是那个拿来生水管垃圾诈骗影片的东西,没办法和色色小影片结合
或者说效果很差
然后开源的能生声音的影片模型LTx语音很假
然后你用TTS去生成语音本身也很难生色色的语音
就算生出来了也因为上述问题对不上嘴
那不如用素材比较快 ==
作者: amsmsk (449)   2026-04-20 14:40:00
声音感觉直接请人配比较便宜省市
作者: ZooseWu (N5)   2026-04-20 14:40:00
有没有推荐的 voice clone 阿,指定声音+指定文本
作者: jeffreyseh (jeffreyseh)   2026-04-20 14:41:00
seedance配音效果就很好 开闭源现在差距还是太大了吗
作者: h0103661 (路人喵)   2026-04-20 14:41:00
有,qwen3tts,自然语言指定声调超神
楼主: Satoman (沙陀曼)   2026-04-20 14:42:00
Qwen3-TTS拿去干什么怪事被抓自己负责 ==
作者: Wardyal (Wardyal)   2026-04-20 14:43:00
感觉那种小黄油嘴对不上也没差吧 反正都是静图
楼主: Satoman (沙陀曼)   2026-04-20 14:43:00
目前的TTS要让他讲色的还是有点卡我是发现语尾加个爱心符号有一点点帮助,但是不多
作者: ZooseWu (N5)   2026-04-20 14:45:00
没办法指定情境或语气吗?我同事之前推荐我voxCPM2 不过我懒得准备素材所以还没试
作者: h0103661 (路人喵)   2026-04-20 14:48:00
两款都能指定,qwen3能塞整个剧本进去生成,情境比voxcpm好很多
楼主: Satoman (沙陀曼)   2026-04-20 14:48:00
我看开源的你没办法录制别人的声音然后调语气大概是阿里巴巴知道有人会拿着去弄色的或诈骗但是现在复制能力就很危险了,诈骗集团越过越爽 ==

Links booklink

Contact Us: admin [ a t ] ucptt.com