[Vtub] AI是不是可以做即时字幕了?

楼主: wei115 (ㄎㄎ)   2023-03-24 17:16:39
如题
像是这部短片 都是日文
看拢无
https://www.youtube.com/watch?v=6Sx13Our0Io
但在chatGPT的加持下
他可根据 google废到笑的日听字幕
大致总结出 这部短片的大纲
https://i.imgur.com/99Wg6Qs.png
这样想想,如果结合语音模组
使用chatGPT应该可以产生出非常具有可读性的即时字幕八?
目前来看可能价格比较高
已一部两小时的直播来说,token数用api计费应该可以到NT1000?
有西恰吗?
作者: IHateNMR (吃饱就睡睡不饱)   2023-03-24 17:18:00
yt不是早就有即时生成字幕了
作者: Julian9x9x9 (Leon)   2023-03-24 17:18:00
早就可以了吧 只是准确度问题
作者: lolic (lolic)   2023-03-24 17:18:00
那就变雅婷逐字稿了
作者: johnny3 (キラ☆)   2023-03-24 17:19:00
即时字幕有个问题 不同文法的字幕断句
作者: vibianus (VL)   2023-03-24 17:19:00
会议软件已经有即时翻译了
作者: cat05joy (CATHER520)   2023-03-24 17:20:00
早就有了吧 实况有种插件就是即时字幕+机翻
作者: johnny3 (キラ☆)   2023-03-24 17:20:00
所以文章比较适合翻译 字幕不适合
作者: greg90326 (虚无研究所)   2023-03-24 17:21:00
到时候给你乱加料
作者: RamenOwl (星爆拉面肥宅)   2023-03-24 17:22:00
为什么我之前把YT影片丢到chatgpt总结 他都掰一堆完全不相干的东西出来
作者: guogu   2023-03-24 17:23:00
你都总结了怎么即时==
作者: BBQman (BBQman)   2023-03-24 17:23:00
不太行,我烤肉会先用YT的字幕功能输出日文字幕来抓时间轴,效果奇差,再翻译成中文一定更破
作者: johnny3 (キラ☆)   2023-03-24 17:23:00
因为chatgpt没资料 你问他他当然无法回答
作者: BBQman (BBQman)   2023-03-24 17:24:00
更不用说Miko,有时候还侦测成韩文
作者: johnny3 (キラ☆)   2023-03-24 17:24:00
这个软件是用api串接 是有资料丢给gpt引擎叫引擎回答的
作者: RamenOwl (星爆拉面肥宅)   2023-03-24 17:24:00
我之前放一个儿童共同注意力的影片,他讲成什么韩国爱心食堂,还有南非反种族隔离运动者夏绿蒂贾尔纳
作者: astrayzip   2023-03-24 17:25:00
即时字幕还有一个问题啊 讲的人口齿不清就没办法辨识
作者: johnny3 (キラ☆)   2023-03-24 17:27:00
yt字幕就我说的切字幕问题 如果是印欧语系互转问题会比较少 因为可以直接1对1换词就好
作者: guogu   2023-03-24 17:28:00
我是有试过漫画图片转文字后丢chatgpt让它翻 非常不行
作者: gasgoose (黑子当兵中)   2023-03-24 17:28:00
看爽的没差 但要求正确性就无法 如果全信被误导的机会也不小 就看目的为何
作者: chung2007 (2007)   2023-03-24 17:29:00
https://www.plurk.com/m/p/p77ea8这里帮你整理好了
作者: bestteam (wombat是胖胖熊)   2023-03-24 17:30:00
还需要时间发展英文的V说不定可以
作者: mistel (Mistel)   2023-03-24 17:31:00
要即时应该有困难 可是反正影片都是上传好的只要转一次就好 so...google的广告以外的商业模式真的很粪 像这种都是商机可以做的结果你在那边跟微软耗@@
作者: a1882991289 (a1882991289)   2023-03-24 17:32:00
怎就有了
作者: work1024 (Q哞)   2023-03-24 17:32:00
英文的已经可以接受了
作者: JACK90142 (JACK90142)   2023-03-24 17:34:00
你目前的即时字幕已经是简单的AI了,旧技术也差不多够成熟。更复杂的技术开发者会着重在理解意思甚至是回应问题,单纯拿来上辅助字幕甚至是翻译这块潜力不足
作者: tsubasawolfy (悠久の翼)   2023-03-24 17:34:00
微软之后要推的网络会议助理就可以语音转文字,还可以帮你写会议纪录
作者: jixiang   2023-03-24 17:36:00
记得日、英好像可以即时
作者: goliath   2023-03-24 17:36:00
其实我觉得可以往解释意思的方向发展 口说翻译真的有难
作者: tsubasawolfy (悠久の翼)   2023-03-24 17:37:00
另外你贴的这功能,我有试过开日本YT影片,然后用edge ai要他总结这影片在讲啥。他还真的去网络搜寻搞出来
作者: find64324 (Tawil)   2023-03-24 17:38:00
PR:…
作者: ikaridon (东)   2023-03-24 17:38:00
都看过人直播即时中翻日的了
作者: showwhat2 (华仔)   2023-03-24 17:43:00
我看过有人直播是一整排不同语言的字幕,但准确率普通。
作者: guogu   2023-03-24 17:45:00
日本直播我看过不少有即时日文字幕加英文翻译的
作者: ryoma1 (热血小豪)   2023-03-24 17:53:00
主要先卡在生成准确度,喂给AI的样本数够多就能先排除第一关,后面翻译就没啥失准问题,像那个AI Vtuber就能跟她的作者做到对答如流甚至互嘴
作者: tsubasawolfy (悠久の翼)   2023-03-24 17:57:00
https://i.imgur.com/I12t35m.png有字幕逐字稿的API比较强XD Bing只能用云的
作者: hylio7754   2023-03-24 17:59:00
我期待即时口译机
作者: ted50704 (ted50704)   2023-03-24 18:09:00
@johnny3
作者: goliath   2023-03-24 18:10:00
总觉得教育AI比教育小孩还有成就感了...
作者: sudekoma (′・ω・`)   2023-03-24 18:21:00
研发影片翻译应该是最吃力不讨好的吧,太容易露馅了
作者: Workshy (Workshy)   2023-03-24 18:35:00
再两三年真的是就不用学外语了
作者: resvb (resvb)   2023-03-24 19:21:00
英文字幕不用ai,即时生成就蛮准的了,看想不想投资源进去而已

Links booklink

Contact Us: admin [ a t ] ucptt.com