Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,797,364字

该文章投稿至Nemo社区   资讯  板块 复制链接


最新 AI 生图模型 Flux1.1 新玩法,添加单反相机文件名获得超写实图像

发布于 2024/10/06 11:57 96浏览 0回复 2,942

最新 AI 文生图模型 Flux1.1,一夜刷屏。

只需一个简单技巧,就能去除图中的“AI 味”,无论人物还是风景都能达到照片级效果。

评论区网友的反应 be like:我分不清,真的分不清啊。

这个技巧用起来也非常简单,在提示词中模仿单反相机的文件命名格式即可。

比如“CR2”就是佳能相机使用的原始图像文件格式,输入“IMG”+ 随机编号 +“.CR2”,再加指定的内容,就能获得一张写实图像了。

后面也陆续有尝试过的网友反馈,换成索尼相机的“ARW”、尼康相机的“NEF”,甚至苹果的“HEIC”格式,都能获得不错的结果。

以至于有人都开始怀疑,不会是模型随机吐出来一张训练数据里的真照片吧?

不过放大看一些特定细节,还是很容易看出确实是 AI 生成的,比如车牌号上的文字都是乱码。

那么是否 Flux1.1 模型本身能力就很强大,这个技巧在其中起到了多大作用呢?

一位资深修图师傅晒出了对比,左边加了 IMG_1018.CR2,对比右边不加的,他认为差别巨大。

我们的实测结果也能看出,加上这个技巧能显著提升画面真实性。

现在想免费试玩这个 Flux1.1 模型,可以来到 together.ai 平台,注册即送 5 美元的积分。

随便生成一张在长城的游客自拍照,乍一看像那么回事,但仔细观察人物皮肤质感、背景山和植物都有还是有一股 AI 味。

换成“IMG_0314.cr2: selfie on The Great Wall”,是不是立马就不一样了?

代号蓝莓,最新 SOTA 文生图模型

随着 FLUX1.1 的正式发布,此前在文生图模型排行榜上屡占榜首的两个无人认领的“蓝莓”模型的神秘面纱也被揭下,正是它。

官方不藏了,直接放出数据,在 Artificial Analysis image arena 上,FLUX1.1 [pro] 以“blueberry”为代号,超越所有其它模型,获得最高的整体 Elo 评分。

相比之下,FLUX1.1 [pro] 价格也更低,速度更快,各项指标超越 Midjourney、SD3、Ideogram 等。

生成速度上,FLUX1.1 [pro] 在保持图像质量、指令响应和多样性提升的同时,速度是前代 FLUX.1 [pro] 的 6 倍。

顺便提一下,现在 FLUX.1 [pro] 也进行了更新,速度是之前的 2 倍,FLUX1.1 [pro] 的速度是目前可用的 FLUX.1 [pro] 的 3 倍。

此外,官方表示即将推出快速高分辨率生成,FLUX1.1 [pro] 可原生支持的那种,在不牺牲任何指令响应情况下,能生成 2k 图像。

FLUX1.1 [pro] 将通过 Together.ai 、Replicate 、fal.ai、Freepik 等在线平台提供。

同时官方还推出了 BFL API,可供其他开发者集成到自己的应用程序中,API 定价是:

  • FLUX.1 [dev]:每张图 2.5 美分(约 RMB 0.18 元)

  • FLUX.1 [pro]:每张图 5 美分(约 RMB 0.35 元)

  • FLUX1.1 [pro]:每张图 4 美分(约 RMB 0.28 元)

Stable Diffusion 原班人马打造

FLUX1.1 [pro] 的背后是 Stable Diffusion 原团队,成员包括 Robin Rombach、Andreas Blattmann、Dominik Lorenz 等。

Robin Rombach

▲ Robin Rombach

其实 Stable Diffusion 最初是一个学术研究项目。

由 Björn Ommer 教授领衔,Robin Rombach、Andreas Blattmann、Dominik Lorenz 等几位慕尼黑大学机器视觉与学习研究小组成员,以及 Runway 的研究人员 Patrick Esser 完成。

研究论文发表七个月后,Stability AI 开始介入,提供计算资源,以进一步开发文本到图像生成模型。2022 年,上述几位论文作者加入 Stability AI。

团队一同创建了 Stable Diffusion XL、Stable Video Diffusion 等。

ICML 2024 最佳论文之一、Stable Diffusion 3 技术论文的 Rectified Flow Transformers,还有 SDXL-Turbo 使用的对抗扩散蒸馏方法(Adversarial Diffusion Distillation),也是这帮子人在研究。

今年三月份这些核心研究团队成员被曝集体辞职。

而后,他们组成了新团队名为 Black Forest Labs(黑森林实验室),总部位于德国。

今年 8 月初刚刚宣布成立,并发布了其初代文生图模型 FLUX.1,FLUX.1 有三个变体:FLUX.1 [pro]、FLUX.1 [dev] 和 FLUX.1 [schnell],平衡了性能和可访问性。

目前黑森林实验室已完成种子轮融资,共融资 3100 万美元,Andreessen Horowitz 领投,Brendan Iribe、Michael Ovitz、Garry Tan、Timo Aila 和 Vladlen Koltun 等跟投。

据说他们还已经收到 General Catalyst、MätchVC 的后续投资。

黑森林实验室和马斯克还有合作,将其图像生成模型引入 xAI 的 Grok 助手中。

接下来,团队透露将推出 SOTA 级文本到视频生成模型

据说他们正在以 10 亿美元的估值筹集 1 亿美元资金,比之前 1.5 亿美元的估值大幅上涨。

从 Pika 1.5 到 Meta Movie Gen,今年下半场视频生成赛道爆火,黑森林实验室的加入,或许会带来不一样的火花。

Flux1.1 试玩

https://api.together.ai/playground/image/black-forest-labs/FLUX.1.1-pro

参考链接:

  • [1]https://x.com/fofrAI/status/1841854401717403944

  • [2]https://blackforestlabs.ai/announcing-flux-1-1-pro-and-the-bfl-api/

  • [3]https://techcrunch.com/2024/10/03/black-forest-labs-the-startup-behind-groks-image-generator-releases-an-api/

本文来自微信公众号:量子位(ID:QbitAI),作者:梦晨、西风,原标题《最新 AI 生图模型 Flux1.1 刷屏!添加单反相机文件名获得超写实图像,网友:我分不清啊》

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/800/324.htm]

本文标签
 {{tag}}
点了个评