Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,668,440字

该文章投稿至Nemo社区   资讯  板块 复制链接


Midjourney V6 超进化,大神网友深度评测来了!画质逼真到可怕,人像图片令人惊呆

发布于 2024/01/20 19:17 199浏览 0回复 2,500

【新智元导读】Midjourney 大神的超深度测评来了!V6 比起 V5.2 究竟有哪些改进?来感受一下吧。

最近,国外的一位名叫 Andrei Kovalev 的大神网友,做出了一份 Midjourney V6 的超深度评测。

指南很专业,V6 和 V5.2 有什么不同,很直观地就能看出来。

下面,就让我们来跟随大神的脚步,深入感受一下 Midjourney V6 的性能有多强吧。

V6 模型,究竟比 V5.2 强在哪

在以往,当我们看一张 AI 生图时,可能马上就会感觉到这是 AI 画的。

但在 Midjourney V6 中,你很少会有这样的感觉。

在这一部分中,Kovalev 介绍了 V6 的优势、劣势,以及和 V5.2 相比的主要变化。

Tim Walker 的高级时装正面肖像,清澈的白色空灵机器人,半透明的皮肤淹没在电线的海洋中。红色和青色色调,发光的高光,深色阴影

▲ V6

▲ V5.2

Kovalev 发现,V6 有以下升级(因为当前还处于 Alpha 测试,以后还会发生变化)。

在遵循提示时更准确了,并且使用更长的提示时,效果会更好。

新模型的一致性大大增强了。

V6 改进了图像提示功能。

现在 V6 有了两个新的升频器,具有微妙和创意模式(都将分辨率提高了两倍)。

有一个「unopinionated」的 --style raw 模式(类似于 V5.2)。

此外,还可以在图像中添加文本了。

所以,V6 究竟变成了什么样子?

超现实主义

以往每次的 Midjourney 升级,都会提升照片的真实感,V6 也不例外。

最能定义 V6 的关键词,恐怕就是超现实主义。

川内凛子的少女太空飞行员摄影肖像

▲ V6

▲ V5.2

总而言之,V6 的逼真度爆表,上升到了一个新台阶,尤其是在摄影风格上,已经到了让人迷惑的程度。

Kourtney Roy 的老海员摄影肖像

▲ V6

而 Midjourney V6 中逼真图像功能之所以如此惊人,恰恰是因为存在缺陷:镜头像差、故意过度突出的区域、意外的失焦元素以及各种胶片效果。

Mitsuo Katsui 拍摄的初音未来照片 --stylize 175

当然,V6 不止是人像画得好。

第比利斯的延时摄影 --stylize 175

而且,在某些情况下需要更微妙的外观和感觉,这时 V6 的超现实主义就显得有些尖锐,显得有些矫枉过正。

Ara Guler 对 1970 年代伊斯坦布尔赌场赌徒的肖像

▲ V6

▲ V5.2

细节很疯狂

每次在 Midjourney 的下一个模型发布之前,许多人都会屏住呼吸,想看看他们会如何处理细节。

V6 中的细节,很疯狂。而新的 upscalers 功能,则让细节更进一步。

Ivan Bilibin 的画作,描绘骑着白狼的冬季领主

▲ V6

▲ V5.2

不过,虽然图像的复杂性随着每个新模型的出现而稳步上升,但在此过程中,却丢失了一些东西,比如纹理。

比如,V4 的精细程度在 V5 + 中提高了十倍,因此几乎不可能实现胶片颗粒或真实笔触这类效果。

虽然离真正的颗粒感似乎仍然遥不可及,但 V6 显然朝着以前失去的原始性,迈出了明确的一步。

它的纹理令人惊叹,比起 V5 来大放异彩(在 V5 中,需要选择「non-refined」的视觉风格)。

Marianna Rothen 的梦幻女孩

▲ V6

▲ V5.2

另一个能很好地描述 V6 的概念,是非常规组合(unconventional composition),这导致了 V5.2 中结构化和平衡方法的重大转变。

以前的模型追求几何完美、黄金比例和中心主体,而 V6 追求不对称,经常将主体从画面中间移开。

Tyrus Wong 的跨维度神秘野兽

▲ V6

▲ V5

这可能会提供更具动态性和吸引力的视觉效果,但也需要相应地调整提示。即使是很小的调整,也可以恢复中心构图和对称性。

可变性增强

可以看到,在 V6 中,同一提示结果的可变性增强了。

与早期模型相比,单个提示的四个变体,通常显示出更明显的差异。

Jessie Willcox Smith 的《银术士》

▲ V6

▲ V5.2

许多情况下,这会产生一种更具创意、更有趣,有时甚至更忠实于现实生活中原型的多样性的艺术风格表现。

艺术风格

在提示中,我们可以引用「Style modifiers」的名称,召唤图像的特定视觉风格、技术、流派、主题或上下文。

像素艺术

▲ V6

▲ V5.2

现在,每个新模型都更善于了解源材料,并且在输出中重新创建它,这已经是一个传统。

然而,Midjourney 从未停止这种戏剧性的变化。

by Jody Bergsma

▲ V6

▲ V5.2

无论这些风格本身多么伟大,真正将它们从对原作的单纯解释转变为独特的东西的,是我们添加的提示。

图片中添加文本

双手拿着报纸,标题为「Midjourney 的文本 - 真实还是骗局?」

▲ V6

▲ V5.2

更多详解,还请参考原文网站。

参考资料

  • https://midlibrary.io/midguide/midjourney-v6-in-depth-review-part-1-overview

本文来自微信公众号:新智元 (ID:AI_era)

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/746/372.htm]

本文标签
 {{tag}}
点了个评