【新智元导读】Midjourney 大神的超深度测评来了!V6 比起 V5.2 究竟有哪些改进?来感受一下吧。
最近,国外的一位名叫 Andrei Kovalev 的大神网友,做出了一份 Midjourney V6 的超深度评测。
指南很专业,V6 和 V5.2 有什么不同,很直观地就能看出来。
下面,就让我们来跟随大神的脚步,深入感受一下 Midjourney V6 的性能有多强吧。
V6 模型,究竟比 V5.2 强在哪
在以往,当我们看一张 AI 生图时,可能马上就会感觉到这是 AI 画的。
但在 Midjourney V6 中,你很少会有这样的感觉。
在这一部分中,Kovalev 介绍了 V6 的优势、劣势,以及和 V5.2 相比的主要变化。
▲ V6 ▲ V5.2Tim Walker 的高级时装正面肖像,清澈的白色空灵机器人,半透明的皮肤淹没在电线的海洋中。红色和青色色调,发光的高光,深色阴影
Kovalev 发现,V6 有以下升级(因为当前还处于 Alpha 测试,以后还会发生变化)。
在遵循提示时更准确了,并且使用更长的提示时,效果会更好。
新模型的一致性大大增强了。
V6 改进了图像提示功能。
现在 V6 有了两个新的升频器,具有微妙和创意模式(都将分辨率提高了两倍)。
有一个「unopinionated」的 --style raw 模式(类似于 V5.2)。
此外,还可以在图像中添加文本了。
所以,V6 究竟变成了什么样子?
超现实主义
以往每次的 Midjourney 升级,都会提升照片的真实感,V6 也不例外。
最能定义 V6 的关键词,恐怕就是超现实主义。
▲ V6 ▲ V5.2川内凛子的少女太空飞行员摄影肖像
总而言之,V6 的逼真度爆表,上升到了一个新台阶,尤其是在摄影风格上,已经到了让人迷惑的程度。
▲ V6Kourtney Roy 的老海员摄影肖像
而 Midjourney V6 中逼真图像功能之所以如此惊人,恰恰是因为存在缺陷:镜头像差、故意过度突出的区域、意外的失焦元素以及各种胶片效果。
Mitsuo Katsui 拍摄的初音未来照片 --stylize 175
当然,V6 不止是人像画得好。
第比利斯的延时摄影 --stylize 175
而且,在某些情况下需要更微妙的外观和感觉,这时 V6 的超现实主义就显得有些尖锐,显得有些矫枉过正。
▲ V6 ▲ V5.2Ara Guler 对 1970 年代伊斯坦布尔赌场赌徒的肖像
细节很疯狂
每次在 Midjourney 的下一个模型发布之前,许多人都会屏住呼吸,想看看他们会如何处理细节。
V6 中的细节,很疯狂。而新的 upscalers 功能,则让细节更进一步。
▲ V6 ▲ V5.2Ivan Bilibin 的画作,描绘骑着白狼的冬季领主
不过,虽然图像的复杂性随着每个新模型的出现而稳步上升,但在此过程中,却丢失了一些东西,比如纹理。
比如,V4 的精细程度在 V5 + 中提高了十倍,因此几乎不可能实现胶片颗粒或真实笔触这类效果。
虽然离真正的颗粒感似乎仍然遥不可及,但 V6 显然朝着以前失去的原始性,迈出了明确的一步。
它的纹理令人惊叹,比起 V5 来大放异彩(在 V5 中,需要选择「non-refined」的视觉风格)。
▲ V6 ▲ V5.2Marianna Rothen 的梦幻女孩
另一个能很好地描述 V6 的概念,是非常规组合(unconventional composition),这导致了 V5.2 中结构化和平衡方法的重大转变。
以前的模型追求几何完美、黄金比例和中心主体,而 V6 追求不对称,经常将主体从画面中间移开。
▲ V6 ▲ V5Tyrus Wong 的跨维度神秘野兽
这可能会提供更具动态性和吸引力的视觉效果,但也需要相应地调整提示。即使是很小的调整,也可以恢复中心构图和对称性。
可变性增强
可以看到,在 V6 中,同一提示结果的可变性增强了。
与早期模型相比,单个提示的四个变体,通常显示出更明显的差异。
▲ V6 ▲ V5.2Jessie Willcox Smith 的《银术士》
许多情况下,这会产生一种更具创意、更有趣,有时甚至更忠实于现实生活中原型的多样性的艺术风格表现。
艺术风格
在提示中,我们可以引用「Style modifiers」的名称,召唤图像的特定视觉风格、技术、流派、主题或上下文。
▲ V6 ▲ V5.2像素艺术
现在,每个新模型都更善于了解源材料,并且在输出中重新创建它,这已经是一个传统。
然而,Midjourney 从未停止这种戏剧性的变化。
▲ V6 ▲ V5.2by Jody Bergsma
无论这些风格本身多么伟大,真正将它们从对原作的单纯解释转变为独特的东西的,是我们添加的提示。
图片中添加文本
双手拿着报纸,标题为「Midjourney 的文本 - 真实还是骗局?」
▲ V6 ▲ V5.2更多详解,还请参考原文网站。
参考资料
https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview
本文来自微信公众号:新智元 (ID:AI_era)
广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/746/372.htm]