百科知识

想知道谭木匠梳子真假?教你几招轻松辨别!

日前,一幅由Midjourney V5生成的中国情侣画像在网络上掀起了巨大波澜。

众多网友纷纷感叹:传统画师们可能需要重新考虑职业规划了。

部分质疑者甚至亲自尝试使用相关指令,结果生成的图像效果令人惊叹。

「一对穿着夹克和牛仔裤的中国年轻情侣,坐在屋顶上,背景是1990年代北京的城市景观,远处可见对面的建筑——v 5 –s 250 –q 2」

自从GPT-4问世后,Midjourney也紧随步伐推出了V5版本,其绘图真实度和指令响应灵敏度均得到了显著提升。

尤其值得注意的是,过去一直被批评的「AI难以精准绘制手指」的问题,在Midjourney V5中得到了完美解决。

生成的图像具有极强的电影氛围感,让人不禁连连称奇。

更有网友戏称:这些模特仿佛真实存在过一般!

技术突破巨大,设计行业或将面临变革

从Midjourney的V1版本到如今的V5,我们可以清晰地看到人工智能生成内容技术在过去一年中的飞速发展。

最新V5版本在图像质量、输出多样性、风格范围、无缝纹理支持、宽高比选择、图像提示精准度以及动态范围等方面均实现了重大突破。

国内用户对此反应热烈,纷纷开始实际操作体验。

率先尝试的写真风格图像显示:

尽管V5能够绘制出五根手指,但在细节表现上仍有提升空间。

例如,当尝试让Midjourney V5描绘梵高的房间时:

在刻画中国女性神态方面,Midjourney V5的表现同样令人满意。

V5成功捕捉了中国古典美学精髓,创作出姿态优雅的仕女图,细节处理极为精致。

还有网友利用GPT-4与Midjourney V5合作,创作了名为「杭州重生」的电影作品,甚至制作了相应的豆瓣介绍页面,其效果出乎意料地逼真。

回顾2022年12月,谭木匠举办的梳子设计大赛中,人类设计师的作品如下:

网友黄仲生使用V5进行创作后,惊讶地发现传统设计在AI面前相形见绌。

当有人指出上述设计过于精美只适合收藏时,网友进一步创作了更具实用性的梳子款式。

此外,还有专为儿童设计的梳子图案。

在国外,有用户利用Midjourney V5创作出《黑客帝国》般的电影视觉效果,其逼真程度让人几乎误以为是真实电影截图。

其使用的指令为:

「基努·里维斯在《黑客帝国》中。人工智能电影。合成摄影。电影感。胶片颗粒感。–ar 16:9 –v 5」

另有网友尝试用「民宅火灾中微笑的女孩」这一经典meme,让Midjourney创作「城堡火灾中微笑的洛基」。

以下是惊人的创作成果。

网友们还创意地将「北京屋顶情侣」图像与洛基元素结合。

还有一个趣味版本:龙卷风中,老太太骑着电动车上演「速度与激情」。

对于亚洲人面部特征的刻画,Midjourney V5同样表现出色。

旅行博主甚至无需外出,只需在家指导Midjourney即可完成创作。

有用户将V4与V5的输出结果进行对比,发现通过相同图片和文字提示,V4在光照条件下物体阴影的处理效果不及V5。

再来看一张眼睛的特写图像。

通过对V3、V4、V5三个版本输入相同的提示和设置,对其生成图像进行了对比分析。

在V5版本中,波光粼粼的水面以及鱼儿游动的倒影效果达到了以假乱真的程度。

然而,若未提供环境文本提示,V5的默认生成环境相比V4显得更为真实。

网友们急切地让V5模仿王家卫《蓝莓之夜》的电影风格,结果显示V5在处理玻璃反射效果方面更加逼真。

以及各种真假难辨的作品:

充满反派气质的马斯克形象:

「戴着VR的猫咪」:

V5相较于V4的主要改进点

最新升级的V5版本在多个方面超越了前一个版本,一位研究员通过对比分析制作了如下表格:

1. 密铺功能(–tile参数)

在创建模式中使用。此前V3具备此参数,但在V4中暂时停用,V5版本重新启用。

例如,输入「/imagine四维空间立方体图案,重复,白色和蓝色高光 –s 1000 –v 5 –tile」,可生成如下图像:

2. 自定义长宽比(–ar参数)

在V4中,仅支持不高于1:2或不宽于2:1的自定义比例。而V5允许用户自定义任何「宽度:长度」比例,如下演示了自定义比例的应用:

这一改进意味着什么?

现代电影常见的最宽比例2.39:1也能轻松实现,这将使每个人都能制作电影级画幅,人人皆可成为导演!

V5生成2.4:1电影画幅

3. 图像权重可自定义(–iw参数)

现在,用户可以在图像提示中输入自定义权重值,从而决定输入图像对最终生成结果的影响程度。

以下是在Midjourney V5中,同时输入一张图片和文本提示的示例。

通过调整不同权重值(2、1、0.5),生成了不同效果的图片。

输入的提示为:「/imagine http://imgur.com/romman.png 罗马士兵背景有雏菊 –seed 123 –iw 2 –v 5」

4. 减少主观倾向性

「减少主观倾向性」意味着,在V4中,只需编写较少文本提示,Midjourney就能生成更具创造性的图像。

但V5不同,用户可能需要提供更多形容词和细节描述,明确指定风格或情绪,以及期望的图像呈现方式。若缺乏详细描述,Midjourney将采用默认风格(如「摄影」风格)。

这一改进使得用户能够通过文本提示更精确地控制Midjourney的输出内容,也意味着文本提示与输出图像之间形成了更强的关联性。

以上四点改进均来自官方博客的介绍,但最令人惊喜的是Midjourney V5成功实现了「绘制五根手指和脚趾」的功能!

此外,V5在更真实的图像/照片基础上进行了微调,因此在处理窗户反射和透过玻璃的画面时效果更加逼真。

视觉挑战:分辨真伪

最后,我们提供一个视觉测试题:

下面四张图片中,只有一张是真实照片,其余均为Midjourney V5生成。请尝试分辨出哪一张是真实图像。

参考资料:

https://bootcamp.uxdesign.cc/midjourney-v5-is-here-so-whats-new-df3f3a645295

https://twitter.com/mranti/status/1637326003927396352?s=46&t=iBppoR0Tk6jtBDcof0HHgg