OPENAI昨天早上推出新的影像生成,放在GPT4o跟Sora上 https://youtu.be/2f3K43FHRKo 新推出来的可以输入文字并固定在上面 可以在不同图片之间固定角色 可以加入细节叙述放在你想要的位置上 然后可以生成真的透明PNG图片 GPT上这功能仅限于使用GPT4o模型,所以免费的好像也可以用? 不太清楚 不是按那个影像生成的DALL-E,直接给图片或者下指令说生成就可以 昨天有先拿他们网页上介绍的文字丢进去看看,但是有些会跳政策限制XD https://openai.com/index/introducing-4o-image-generation/ 这是昨天测试的图 https://i.imgur.com/H9xm9bO.png 这是今天测试的图 https://i.imgur.com/jSEz3SP.png 两个都是同样的文字复制贴上,所以这功能大概今天才推到我帐号上? 所以就拿实体物的影像测试一下 https://i.imgur.com/lfcOCXl.jpeg 要他弄成看起来像吉卜力工作室风格 ( Make it looks like ghibli studio style) 昨天会拒绝说是政策关系,但今天就可以。也可能是指令改成"看起来像" https://i.imgur.com/1A9uV6t.png 注意这边还有保留底座 接着再下 左边的加入"Roar"的对话泡泡,右边的加上 "HAHA" (Add "Roar" talking bubble to left one, and " HAHA" to the right one.) https://i.imgur.com/CgYM6cY.png 的确可以加入文字跟指定对象,但是一些细节会消失,像底座跟头发 再来加入把他们放入时代广场里面 (Keep these two characters and their styles. Put them to Time Square. ) https://i.imgur.com/v3VUqet.png 的确加进时代广场当背景,顺便也把时代广场改成吉卜力风格 但人物的更多细节消失了 所以最后重开一个新的chat 把上面那些一次输入 https://i.imgur.com/eE4ym6u.png 细节保留但同时GPT也修改表情去符合出现的字 所以如果有什么想法一次给他大概是最好的? 再来拿出黏土人,拍一张后上传给他说摆进有樱花的日本庭园 https://i.imgur.com/F4JWM5Q.png 这边注意到的是原本拍的时候有故意扭头侧身,但GPT把人物拉正了 最后要他拿一开始给的图,改成南方公园的风格,产生一个四格漫画的笑话 https://i.imgur.com/MyxhdQe.png 查了一下是老爸笑话没错 Sora 部分还没测试,但是看reddit说比4o可以绕更多版权? 这新功能看Reddit上有做数位广告的出来说我毁了