[情报] Tiktok发布AI模型“OmniHuman-1”

楼主: LimYoHwan (gosu mage)   2025-02-07 13:53:28
标题:
字节跳动发布AI模型“OmniHuman-1”:让黄仁勋变Rapper、泰勒丝唱日文歌…网赞超逼

来源:
Blocktempo
网址:
https://tinyurl.com/mtuddvts
内文:
在中国 AI 新创公司 DeepSeek 上月向全球 AI 界投下震撼弹之后,TikTok 母公司字节
跳动近期也吸引了全球 AI 界的关注。据《Forbes》报导,字节跳动在 2 月 5 日公布了
其最新 AI 模型 OmniHuman-1,该模型允许用户仅透过一张静态图片加上搭配的音频,就
能生成一个栩栩如生的影片,包括人物说话时的口型、手势等细节,都能得到细致的刻画

目前社群上已经有释出部分 OmniHuman-1 使用成果,例如:黄仁勋唱 Rap、爱因斯坦演
讲、泰勒丝唱青鸟…效果相当逼真。纽约大学教授 Samantha G. Wolfe 就表示:
从技术角度来看,仅仅根据一张图片,就能创造出来看起来真的会说话、会动的人物形象
,这非常令人着迷。
OmniHuman-1 特性有哪些?
据官方说明,OmniHuman-1 的关键特性包括:
多模态输入:OmniHuman-1 模型支援文本、语音和影片等多种输入形式,由此生成的数位
人物可以在不同的场景中展示出丰富的情感与动作;
高质量输出:OmniHuman-1 由于具备先进的深度学习技术,能够生成包含真人、动漫人物
、3D 人物等高质量数位形象,可用于直播、娱乐、教育等众多场景;
实时生成:OmniHuman-1 具备实时生成的能力,在互动中,用户能够即时获得数位人物的
反馈;
表现力强:在多种驱动模式下,由 OmniHuman-1 生成的数位人物能够完成具有挑战性的
动作,进一步提升了影片的真实感和表现力。
OmniHuman-1 引人担忧
不过虽然 OmniHuman-1 的强大功能让人赞叹 AI 可能为人类生活带来的改变,当前社群
对这一模型也产生了一些担忧,具体来看包括:
身份冒用:该模型看起来能够精确复制特定个人的容貌和动作,可能会被用于恶意模仿和
身份诈欺;
资讯操纵:当前 AI 最令人担忧的负面影响之一,就是可能会催生网络虚假资讯的泛滥,
这可能严重影响公共舆论和社会认知;
隐私侵犯:该模型的推出,也可能导致恶意分子在未经许可的情况下,擅自重建和操纵个
人形象,例如利用某明星的图片制作色情影片等,可能引发伦理问题。
不过要说明的是,当前虽然字节跳动已经推出 OmniHuman-1 模型,但目前该模型尚未正
式投入商业使用,官方也尚未清楚说明具体释出时间。
另一方面,字节跳动掌管着抖音这一中国当前最热的社交媒体平台,但 OmniHuman-1 的
推出似乎在中国社群内部的讨论度还不高,颇令人玩味。
OmniHuman:通过一张图片配合音频或视频,生成非常自然的会说话、唱歌的人类动作视

支持各种不同类型输入(如单一的人物图片和音频、视频等信号)生成非常逼真真人视频
动画,涵盖从面部表情到全身动作,无论是说话、唱歌、跳舞等。
OmniHuman 在生成动画时能够保持极高的真实感,能够精确捕捉到人类的面部表情、身体
动作、手势变化、物体交互等细节,超越了现有的方法。
支持手势、肢体语言、舞蹈动作等自然动画。
支持脸部特写(Close-up)、半身(Half-body)、全身(Full-body) 动画。
可适应不同画面比例(如 16:9、9:16、1:1)。
能够处理各种人体姿势和全身动作,尤其是在面对复杂的运动和物体交互时,表现出更高
的准确度。
https://www.xiaohu.ai/c/xiaohu-ai/omnihuman
作者: goodapple807 (Archi)   2025-02-07 13:58:00
所有人都要有AI 笑死
作者: herculus6502 (金麟岂是池中物)   2025-02-07 14:00:00
股版快变成AI版了
作者: calmerrorans (虎烂抠)   2025-02-07 14:01:00
校署 开始蒸馏你的蒸馏 疯狂推出
作者: blacklight27 (蛇蛇)   2025-02-07 14:02:00
太神啦 中国
作者: PureAnSimple (PureAndSimple)   2025-02-07 14:32:00
不重要 不用每天po模型 有钱赚吗?
作者: madeinheaven   2025-02-07 15:23:00
这又不是新东西 早就有了
作者: Grothendieck (A. Grothendieck)   2025-02-07 17:28:00
干片自动生成
作者: letyouselfgo (坚持才知为何)   2025-02-07 21:06:00
既然有人做开源 应用就会爆炸性的产出
作者: fantasyscure (台湾狼)   2025-02-08 00:00:00
完了 泰勒丝以后出现在番号上不意外

Links booklink

Contact Us: admin [ a t ] ucptt.com