DeepMind发布Genie 2“基础世界模型”,单图可生成1分钟3D游戏世界
https://www.techbang.com/posts/120000-deepmind-releases-genie-2-an-ai-model-
that-can-generate
https://tinyurl.com/4thtp2u7
在AI研究中,游戏一直扮演着至关重要的角色。因为具有以引人入胜的特性、独特的挑战
组合以及可衡量的进展,游戏成为了安全测试和提升AI能力的理想环境。
自Google DeepMind成立以来,游戏一直都是研究的核心——从早期的Atari游戏研究,到
AlphaGo和AlphaStar等突破性成果,再到与游戏开发者合作研究通用智慧体。
Google DeepMind(AlphaGo的幕后团队)发布了 Genie 2,这是一款开创性的工具,可根
据单个图像提示生成交互式 3D 世界。 这个新模型旨在帮助训练和测试人工智能代理,
允许他们使用键盘和鼠标输入与这些动态环境进行互动。 根据 DeepMind 的说法,它可
以在各种互动环境中训练和测试人工智能代理,以下是其主要功能的细分:
角色动作可控
Genie 2 可对键盘和鼠标输入等动作做出反应,让人或人工智能与环境互动。 例如,当
你按下方向键时,它就会明白必须移动角色,从而不会错误地移动树木或云朵等物体。
例如,模型必须计算出,箭头键应该移动机器人,而不是移动树木或云朵。
即时建立新内容
它可以建立新的、一致的内容,同时随着时间的推移保持世界的完整性,确保环境始终以
可信的方式不断发展。
Genie 2 可以对物理、重力和光照等复杂的互动进行建模,甚至可以制作角色动画和模
拟非游戏角色 (NPC) 的行为。 它可以处理从水流效果到角色移动和烟雾等一切效果。
系统还可以从同一起点生成不同的路径。 这一功能允许研究人员测试不同的结果,为培
训目的提供了一种模拟各种体验的方法。
支援用真实世界图像生成
不仅限于电脑生成的图像,Genie 2 还可以使用真实世界的照片作为提示,模拟风吹草动
或水流等自然元素。
Genie 2还有长时间记忆的功能,能够记住那些暂时离开画面的场景,并在它们重新进入
视野时,精确地还原出来。
快速打造游戏原型
研究人员可以使用 Genie 2 快速建立交互式体验,以便在不同环境中进行快速测试和培
训。 它可以将概念艺术或图纸转化为完整的互动世界。
像Genie 2这样的生成式人工智能并非没有争议。 版权和智慧财产权问题是这一领域的主
要症结所在。 此类模型通常是在从Internet上获取的资料集上进行训练的,其中有时包
括受版权保护的资料。
艺术家、游戏开发者甚至科技公司都对未经授权使用他们的内容来训练这些模型表示担忧
。 在生成式人工智能的其他领域, 已经出现了针对 OpenAI 和 Stability AI 等公司的
诉讼,原告认为他们的作品未经许可被使用。 不难想像这里也会出现类似的案件,尤其
是当这些人工智能生成的世界与人类创造的设计越来越难以区分时。
对资料采集行为的广泛批评又增加了一层复杂性。 许多人对 Meta 和 X 等公司感到失望
,因为这些公司使用其平台上的使用者资料来训练模型,而这些资料往往未经使用者明确
同意。
Genie 2: A large-scale foundation world model
https://deepmind.google/discover/blog/genie-2-a-large-scale-foundation-world-
model/
https://tinyurl.com/yjhdecka