楼主:
liquidbox (æ¨¹æžæ“ºæ“º)
2025-08-03 17:48:59※ 引述《medama ( )》之铭言:
: 如题
: 民视新闻拿网络影片报导巴基斯坦记者
: 在洪水中连线播报被冲走
: https://i.meee.com.tw/MHJRz2y.png
: 底下留言都觉得水都淹过脖子怎么还站得稳
: 是不是AI影片?
: 但民视新闻坚持说不是AI影片
: https://i.meee.com.tw/PnCVwPw.png
: https://i.meee.com.tw/SvsVDAo.png
: 原影片在此:https://www.youtube.com/watch?v=tiLgUcWv9s0
: 有没有AI达人帮忙辨认一下这是不是AI影片啊?
我觉得这应该是真实的影片,但有待真正高手来确认
这支影片画质不高、但水跟效果很真实,影片又长,
虽然最近很多AI灾难假影片,但这支真的不像
AI影片通常有明确的画面主体,绝大部份是人,
剩下的可能位于画面中心的动物或自然界山水
AI影片画质蛮细腻的,这支影片画质颗粒很大
AI影片的打光通常很放在画面主体,但这支影片光线很“自然”
AI影片要让人跟唇型配合难度超高,至少我目前手边开源工具是做不到的
我查了一下,确实网络上有些付费AI影片生成服务支援声音对嘴
但那些都是搭配客服机器人的,所以一样是以人物为画面主体的半身照,
而不是像这支影片虽然以人为主体,但画面大部份是水
在肢体动作上,AI生成影片的人类要嘛不太动,要嘛有很多无意义的东摸西摸动作
这支影片中的人,他的动作只用在两个:对抗水流跟即时报导
要用prompt这么准确控制又不让他有多余动作,至少我觉得很难
而且这支影片比起网络上、在不剪接的情况下大多只有5到10秒的AI影片来说,
一镜到底,人物又没有多余无意义动作,不像AI生成的
另外,AI生成人声我也略懂略懂,
至少我目前抓下来的工具(不是单纯的text-to-speech),让AI模仿特定人的声线,
但要戏剧化到像新闻中一样扯著喉咙在报导,我的开源工具做不到
而且AI模仿人声也没那么好控制,常有不照指令的现象,
语调轻重缓急要对,还要刚好搭到AI影片的嘴型,
至少弱弱的我觉得很难
纯就影片来说,也许真的有人无聊到去训练一个微调模型,供生成灾难型影片
(但如我前面说的,AI生成影片通常画质都很细腻,没这支那么粗糙)
要再生成人类、以及用AI生成可以跟影片人物嘴型对上的音档,很不容易
也许影片可以用AI生、音档由人事后配再后制,但超麻烦
这支影片以真人摆拍的难度反而低多了
只要这名记者站在水位稍低的水里蹲著、让水差不多盖过脖子即可,
蹲坐着时手上抓着什么东西维持稳定
同时让画面不要太广角摄入太多周边画面,就可以营造出记者在深水里冒命报导的假象
这个台湾记者应该就做得了