Fw: [新闻] Gemini 3 Pro Image：“Nano Banana Pro empliu PTT批踢踢实业坊

Fw: [新闻] Gemini 3 Pro Image：“Nano Banana Pro

楼主: empliu (善恶相杀) 2025-11-21 01:23:31

※ [本文转录自 Stock 看板 #1f7qfhFx ]
作者: empliu (Liu) 看板: Stock
标题: [新闻] Gemini 3 Pro Image：“Nano Banana Pro
时间: Fri Nov 21 01:05:41 2025
原文标题：
Gemini 3 Pro Image：“Nano Banana Pro”重新定义 AI 影像生成
原文连结：https://o3o.us/dKrxQ7
发布时间：November 21, 2025
记者署名：TechApple.com 编辑部
原文内容：
在生成式 AI 竞争白热化的当下，Google DeepMind 再次抛出重磅更新。全新影像生成引
擎——Gemini 3 Pro Image，其核心驱动更是被命名为极具话题性的 “Nano Banana Pro
”。这不仅是画质的提升，更是对“精准控制”与“工作室级品质”的一次全面宣战。在
Google AI Studio和AI Studio已经上线，注意有部份地区未必能用。
工作室级的精准控制：从“抽卡”到“设计”
过去的 AI 绘图往往被戏称为“抽卡”，但在 Nano Banana Pro 的加持下，Gemini 3
Pro Image 将重点完全转向了 “Studio-quality control（工作室级控制）”。
这款模型的核心承诺在于“对影像的每一个细节进行精细控制”。这意味着创作者不再需
要反复尝试随机的 Prompt，而是能够真正像使用专业软件一样，对画面进行精确的调度
。
角色与场景的完美融合
对于叙事类创作者而言，最大的痛点莫过于角色的一致性。Gemini 3 Pro Image 在这方
面展现了强大的能力。官方资料明确指出，使用者可以 “将你的角色放入全新的场景中
，并更换新的服装”。这一功能直接打破了过去 AI 生成中“换个场景就换张脸”的魔咒
。
更进一步，它支援 “混合多张参考图像”，并能构建出保留了选定细节的复杂构图。这
不仅仅是简单的拼贴，而是能够协助创作者 “在一系列影像中勾勒出完整的故事”。从
单图生成进化到连贯叙事，这是 AI 进入专业工作流的关键一步。
突破文字与知识的边界：海报与图表的终极解决方案
长期以来，AI 在生成图片中的文字时总是“力不从心”，出现乱码或拼写错误是家常便
饭。Gemini 3 Pro Image 对此进行了针对性的优化。
清晰的文字生成能力
DeepMind 强调，新模型能够 “为海报和复杂图表生成清晰的文字”。这对于平面设计师
和行销人员来说是一个巨大的福音。你不仅可以直接生成带有正确标语的海报，甚至可
以 “将你的设计翻译成不同的在地化语言”。这意味着，一个设计稿可以快速裂变为适
应全球不同市场的版本，极大地提升了跨国行销的效率。
基于现实世界的知识库
除了文字，模型的“脑子”也更好用了。利用 Gemini 庞大的现实世界知识，该模型能够
交付 “精确的结果”，这在生成 “复杂的资讯图表” 或 “历史精确的场景” 时尤为
重要。它不再是凭空捏造，而是基于数据和事实进行视觉化呈现，这让它在教育和专业简
报领域的应用潜力大增。
强大的后期编辑流：修复、光影与混合
Gemini 3 Pro Image 不仅是一个生成器，更是一个强大的编辑器。它引入了进阶的创意
工作流支援，让使用者可以 “测试想法、创建引人注目的设计并制作原型”。
多模态的理解与编辑
透过 “上传图像并分享文字指令”，使用者可以用最自然的语言与 AI 沟通。想要微调
？没问题。你可以利用其 “多模态理解（Multimodal understanding）” 能力，对画面
进行复杂且详细的修改。
高阶编辑功能
官方特别提到了几个令人印象深刻的高阶功能：
遮罩编辑（Masked editing）：对特定区域进行精准修改。
大幅度光影变换：例如直接将画面从 “白天变为黑夜”，这需要模型对光线物理有极深
的理解。
影像混合：将不同素材无缝拼接，创造出全新的视觉体验。
这些功能让 Gemini 3 Pro Image 能够承担起“修图师”的角色，而不仅仅是“画师”。
诚实的技术报告：不回避缺陷的透明度
与许多过度包装的 AI 产品不同，DeepMind 在发布页面上展现了难得的技术诚实，详细
列出了模型目前的局限性。这种“自我揭短”反而增加了专业用户的信任度。
目前的技术瓶颈
尽管冠以 “Pro” 之名，官方坦承 “并非 Gemini 生成的每张图像都是完美的”。以下
是目前仍可能遇到的挑战：
细节处理：模型在处理 “小脸（small faces）”、“准确拼写” 以及影像中的 “精
细细节” 时仍可能感到吃力。
复杂数据的误读：虽然拥有丰富的知识，但在生成 “资讯图表、标注图表或呈现复杂数
据” 时，它可能会 “误解资讯或产生与事实不符的结果”。官方强烈建议使用者 “务
必验证数据驱动的输出结果”。
语言与文化的隔阂：虽然支援多语言翻译，但在 “语法、拼写、文化细微差别或成语
” 方面仍可能遇到困难。
物理逻辑的瑕疵：在进行如“日夜变换”或“影像混合”等高阶操作时，有时会产生 “
不自然的结果、视觉伪影或不连贯的场景”。
心得/评论：
Google高层前几天就有预告
前天的Gemini 3发布只是前菜而已
今天在图像领域发表新的香蕉Pro出来炸场了
补一个我在FB中文社群看到极可怕的案例
入门级的美编这个周末夜难眠了
汉化组/台湾出版翻译漫画看过吧
来自 Jas Chiang
https://i.imgur.com/Vk4RlEi.mp4
真的变态的可怕
===
这是我自己在路边摊拍的卤肉饭
https://i.imgur.com/eOxnl7M.png
请帮我生成专业的广告照
https://i.imgur.com/tA6TETn.png
请让金城武代言这碗卤肉饭
https://i.imgur.com/ohT85GX.png
其他案例
出师表+石牌
https://i.imgur.com/leh3cW7.jpeg
饶河夜市+妹子
https://i.imgur.com/GOcRyhF.png
吹风机广告
https://i.imgur.com/NjSlNuu.png
https://i.imgur.com/QUFwmEq.png
https://i.imgur.com/2uRfcBu.png
https://i.imgur.com/bBpZPXL.jpeg
手冲咖啡图 by Fox Hsiao
提示词 : "请画出一张手冲咖啡流程图附上简单说明，日本流行杂志风格，但是说明文字
是台湾繁体中文"
https://i.imgur.com/EWUnPKn.png

继续阅读

[问卦] 脆上一堆女的交不到男朋友?DOOHDLIHC Re: [问卦] 币蛙484快断气了？？Beanoodle [新闻] 言情小说席绢“宣布封笔”最后一封情书godofsex [问卦] 不可能涨800跌800吧NUMB43 [问卦] TWICE来开唱高雄有收到场租吗？mongi Re: [问卦] 为啥二战中国没摆烂投降？Sam27 [问卦] 安扣还好吗...阿肥在此郑重道歉..notanyone [问卦] AI母体什么时候会统治地球人类?autokey [问卦] 买了票见却不到偶像会有多伤心?zatti [问卦] 运动细胞好出社会可以干嘛？oneyoung1121