Fw: [新闻] Gemini 3 Pro Image:“Nano Banana Pro

楼主: empliu (善恶相杀)   2025-11-21 01:23:31
※ [本文转录自 Stock 看板 #1f7qfhFx ]
作者: empliu (Liu) 看板: Stock
标题: [新闻] Gemini 3 Pro Image:“Nano Banana Pro
时间: Fri Nov 21 01:05:41 2025
原文标题:
Gemini 3 Pro Image:“Nano Banana Pro”重新定义 AI 影像生成
原文连结:https://o3o.us/dKrxQ7
发布时间:November 21, 2025
记者署名:TechApple.com 编辑部
原文内容:
在生成式 AI 竞争白热化的当下,Google DeepMind 再次抛出重磅更新。全新影像生成引
擎——Gemini 3 Pro Image,其核心驱动更是被命名为极具话题性的 “Nano Banana Pro
”。这不仅是画质的提升,更是对“精准控制”与“工作室级品质”的一次全面宣战。在
Google AI Studio和AI Studio已经上线,注意有部份地区未必能用。
工作室级的精准控制:从“抽卡”到“设计”
过去的 AI 绘图往往被戏称为“抽卡”,但在 Nano Banana Pro 的加持下,Gemini 3
Pro Image 将重点完全转向了 “Studio-quality control(工作室级控制)”。
这款模型的核心承诺在于“对影像的每一个细节进行精细控制”。这意味着创作者不再需
要反复尝试随机的 Prompt,而是能够真正像使用专业软件一样,对画面进行精确的调度

角色与场景的完美融合
对于叙事类创作者而言,最大的痛点莫过于角色的一致性。Gemini 3 Pro Image 在这方
面展现了强大的能力。官方资料明确指出,使用者可以 “将你的角色放入全新的场景中
,并更换新的服装”。这一功能直接打破了过去 AI 生成中“换个场景就换张脸”的魔咒

更进一步,它支援 “混合多张参考图像”,并能构建出保留了选定细节的复杂构图。这
不仅仅是简单的拼贴,而是能够协助创作者 “在一系列影像中勾勒出完整的故事”。从
单图生成进化到连贯叙事,这是 AI 进入专业工作流的关键一步。
突破文字与知识的边界:海报与图表的终极解决方案
长期以来,AI 在生成图片中的文字时总是“力不从心”,出现乱码或拼写错误是家常便
饭。Gemini 3 Pro Image 对此进行了针对性的优化。
清晰的文字生成能力
DeepMind 强调,新模型能够 “为海报和复杂图表生成清晰的文字”。这对于平面设计师
和行销人员来说是一个巨大的福音。你不仅可以直接生成带有正确标语的海报,甚至可
以 “将你的设计翻译成不同的在地化语言”。这意味着,一个设计稿可以快速裂变为适
应全球不同市场的版本,极大地提升了跨国行销的效率。
基于现实世界的知识库
除了文字,模型的“脑子”也更好用了。利用 Gemini 庞大的现实世界知识,该模型能够
交付 “精确的结果”,这在生成 “复杂的资讯图表” 或 “历史精确的场景” 时尤为
重要。它不再是凭空捏造,而是基于数据和事实进行视觉化呈现,这让它在教育和专业简
报领域的应用潜力大增。
强大的后期编辑流:修复、光影与混合
Gemini 3 Pro Image 不仅是一个生成器,更是一个强大的编辑器。它引入了进阶的创意
工作流支援,让使用者可以 “测试想法、创建引人注目的设计并制作原型”。
多模态的理解与编辑
透过 “上传图像并分享文字指令”,使用者可以用最自然的语言与 AI 沟通。想要微调
?没问题。你可以利用其 “多模态理解(Multimodal understanding)” 能力,对画面
进行复杂且详细的修改。
高阶编辑功能
官方特别提到了几个令人印象深刻的高阶功能:
遮罩编辑(Masked editing): 对特定区域进行精准修改。
大幅度光影变换: 例如直接将画面从 “白天变为黑夜”,这需要模型对光线物理有极深
的理解。
影像混合: 将不同素材无缝拼接,创造出全新的视觉体验。
这些功能让 Gemini 3 Pro Image 能够承担起“修图师”的角色,而不仅仅是“画师”。
诚实的技术报告:不回避缺陷的透明度
与许多过度包装的 AI 产品不同,DeepMind 在发布页面上展现了难得的技术诚实,详细
列出了模型目前的局限性。这种“自我揭短”反而增加了专业用户的信任度。
目前的技术瓶颈
尽管冠以 “Pro” 之名,官方坦承 “并非 Gemini 生成的每张图像都是完美的”。以下
是目前仍可能遇到的挑战:
细节处理: 模型在处理 “小脸(small faces)”、“准确拼写” 以及影像中的 “精
细细节” 时仍可能感到吃力。
复杂数据的误读: 虽然拥有丰富的知识,但在生成 “资讯图表、标注图表或呈现复杂数
据” 时,它可能会 “误解资讯或产生与事实不符的结果”。官方强烈建议使用者 “务
必验证数据驱动的输出结果”。
语言与文化的隔阂: 虽然支援多语言翻译,但在 “语法、拼写、文化细微差别或成语
” 方面仍可能遇到困难。
物理逻辑的瑕疵: 在进行如“日夜变换”或“影像混合”等高阶操作时,有时会产生 “
不自然的结果、视觉伪影或不连贯的场景”。
心得/评论:
Google高层前几天就有预告
前天的Gemini 3发布只是前菜而已
今天在图像领域发表新的香蕉Pro出来炸场了
补一个我在FB中文社群看到极可怕的案例
入门级的美编这个周末夜难眠了
汉化组/台湾出版翻译漫画看过吧
来自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
真的变态的可怕
===
这是我自己在路边摊拍的卤肉饭
https://i.imgur.com/eOxnl7M.png
请帮我生成专业的广告照
https://i.imgur.com/tA6TETn.png
请让金城武代言这碗卤肉饭
https://i.imgur.com/ohT85GX.png
其他案例
出师表+石牌
https://i.imgur.com/leh3cW7.jpeg
饶河夜市+妹子
https://i.imgur.com/GOcRyhF.png
吹风机广告
https://i.imgur.com/NjSlNuu.png
https://i.imgur.com/QUFwmEq.png
https://i.imgur.com/2uRfcBu.png
https://i.imgur.com/bBpZPXL.jpeg
手冲咖啡图 by Fox Hsiao
提示词 : "请画出一张手冲咖啡流程图附上简单说明,日本流行杂志风格,但是说明文字
是台湾繁体中文"
https://i.imgur.com/EWUnPKn.png

Links booklink

Contact Us: admin [ a t ] ucptt.com