
上周我对多个生图模型进行了体验,其中 Gemini生图模型已经相当实用,但Open AI的GPT-4o图像生成模型一发布,便迅速在全网引起热议。它的效果究竟如何?是否真的如传闻般强大?我带着好奇心进行了深度体验,结论为:GPT-4o生成的图像确实比Gemini的更出色,但并非完美无缺。
为了更深入地了解GPT-4o,我进行了为期两天的深度体验。它强大的功能让我印象深刻,特别是在图像生成方面。我用它尝试了许多不同的使用场景,发现它在许多方面都表现出色。
关于GPT-4o的使用,我要说明一下。有些人可能会发现即使不充会员也能使用GPT-4o,但生成的图像效果往往不尽如人意。这是因为免费用户无法访问新的图像生成模型,每天免费使用的次数实际上是使用了Dall-E模型,而不是最新的绘图模型。
为了更充分地体验GPT-4o的功能,我进行了充值,选择了更多的“创建图片”选项。在使用过程中,我发现只需要购买plus会员即可,无需购买每月200美元的会员,那样太浪费了。从我使用的情况来看,plus会员就可以一直生图,而且在我体验的两天内并未出现限制情况。
对于充值问题,我自己试了一圈,最终发现办理一张虚拟是最方便、快捷的方式。我使用的虚拟卡网址是 Bewildcard(),注册开卡流程非常简单。
在解决了充值问题后,我开始了愉快的生图之旅。GPT-4o有许多令人惊艳的应用场景,让我一一为您介绍。
1. 生成组图:我直接挑战了高难度任务,让它在同一个画面中同时生成一批带有对应特征的内容。尽管这在其他AI生图能力上看起来超纲了,但GPT-4o的表现却令人惊喜。提示词中的各个元素,位置、内容完全正确,风格和细节程度也做到了统一。
2. 风格转换:GPT-4o具备类似comfy UI中的ControlNet功能,可以完全复刻参考图中的人物姿势,或根据线稿生成指定风格的图像。我进行了一系列测试,发现它可以将普通插图转换成写实照片、海贼王风格、乐高风格等,效果令人惊艳。
3. 生成海报:GPT-4o还能根据自身的知识库,生成符合用户意图的配图。比如我为百科全书画了一张插图,它根据矢量插图风格生成了不同类型的星球插图,并附上了星球的名字和简介。背景设计也非常出色,完全符合我的需求。
除了上述场景,GPT-4o还能进行虚拟试穿、动漫设计、改图标风格、图像提取、AI找图、老旧照片上色、一键修图等。这些功能大大简化了设计师的工作流程,提高了工作效率。
GPT-4o并非完美无缺。它在处理中文提示词时还存在一些不足,对一些细节的迁移处理也有瑕疵。出图速度较慢,偶尔会出现限速情况。尽管如此,我相信这些问题很快会被迭代解决。
