Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,798,005字

该文章投稿至Nemo社区   资讯  板块 复制链接


神秘“蓝莓”登顶文生图模型竞技场,被指 Flux.1 续作

发布于 2024/09/30 10:09 110浏览 0回复 1,758

都来玩这套。继 OpenAI“草莓”之后,又有神秘模型蓝莓来“霸榜”。

在文生图模型排行榜上,两个“无人认领”的模型 blueberry_0blueberry_1 力压 Flux.1、Ideogram v2、Midjourney v6.1 等知名模型,成为最新榜一榜二大哥。

一些生成效果 be like,确实不错。

不过这一次,未必是 OpenAI 跨界来搞事,背后公司更可能是打造了 Flux 的黑森林实验室

为啥?来看这组 PK。blueberry_0 生成的大胡子男人,和 Flux Pro 的几乎一模一样。

有人猜测,难道是 Flux 的新版本?

我们实测时也发现了类似的情况,blueberry_1 在同一提示词下,生成图像从构图、光线到细节,与 Flux.1 [pro] 非常像。

有网友就评论说,这真的很有意思。

公司在发布新模型之前先把它放在模型竞技平台上,大多数时候用户也能猜的出来它来自哪家公司。

……

这几乎是一种免费打广告的形式了。而且就是能吸引到目标用户。

对提示词理解更精准

现在,在竞技场中随机匹配即可“偶遇”两个蓝莓模型。从实际生成效果中可以找寻出蓝莓模型的一些特点。

比如和 Midjourney v6.1 对比,blueberry_1 在细节和真实性上更好。

Midjourney 生成的人物手部不够自然,眼睛看着的是桌子而不是收银机,背带裤扣子也很奇怪。

相对而言,blueberry_1 整体更协调,光线更自然。

和 Stable Diffusion XL 1.0 比较,写实性更好。

和 FLUX.1 [dev] 对比,blueberry_0 对提示词的理解更精准,细节处理能力更强。

提示词中提到的山谷中充满神秘物种,FLUX.1 [dev] 只画了一个。

但是也有一些情况,blueberry_0 的表现不算突出。觉得谁更好或许就见仁见智了。

除此之外,还有网友发现蓝莓模型在生成图像中的文本上表现不佳。

从数据上来看,两个蓝莓模型之间的差距并不大。从生成质量和速度两个维度评判,它们也都处于第一梯队。

相对而言 blueberry_0 的生成质量更高一点点。如下结果是基于模型在竞技场中 PK10000 次以上后进行评定。

生成速度上也是 blueberry_0 更快。

竞技场胜率上,blueberry_0 排第一,Flux.1 [pro] 第二,blueberry_1 第三。

网友:是 OpenAI 还是黑森林?

目前还无人认领“蓝莓”模型,网友们的猜测还在继续。

有人觉得它在细节上还有很多问题,不太可能是 OpenAI 的模型。

比如小屋出现了两个门把手。

下图人物被挡住的胳膊和手有问题。

但也有人说,最近 OpenAI 员工透露会有新模型,有可能是 OpenAI 悄悄发布。

当然,也有人质疑“蓝莓”模型分数虚高,在一些情况下它的表现不及 Dall・E 3。

我感觉结果被操纵了,这样它们就能拿着这些成绩去给投资人看。“蓝莓”很明显就是参考了“草莓”的做法,而“草莓”模型就很可疑。

你觉得呢?现在也可以去竞技场上实测“蓝莓”模型效果。

传送门:

https://artificialanalysis.ai/text-to-image/arena

参考链接:

  • [1]https://www.reddit.com/r/singularity/comments/1fpwuu7/a_new_mysterious_image_gen_model_called_blueberry/

  • [2]https://x.com/search?q=Blueberry%20Black%20Forest%20Labs&src=typed_query

本文来自微信公众号:量子位(ID:QbitAI),作者:明敏,原标题《神秘「蓝莓」登顶文生图竞技场,疑似 Flux.1 续作,网友:都来免费打广告了》

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/799/473.htm]

本文标签
 {{tag}}
点了个评