-
神秘模型“小熊猫”一夜刷屏:排名超 Flux、Midjourney
一夜之间,名为“red_panda” (小熊猫)的神秘文生图模型狠狠火了!!登顶文生图竞技场,直接将Flux、Midjourney等一众顶尖模型踩在脚下——其ELO得分比Flux1.1Pro高出100多,胜率高达79%,每7秒就能生成一张图像。生成效果belike:啥概念呢?按网友的话说,这家伙搁这跳级呢!这与从Flux1schnell到Flux1.1Pro的跳跃相同除了强得可怕,red81 0 2024-10-29 13:42
-
文生图 AI Midjourney 雄心:7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域
IT之家9月13日消息,科技媒体TheDecoder昨日(9月12日)发布博文,报道称在最近的“OfficeHours”活动中,Midjourney创始人兼首席执行官DavidHolz在Discord分享了当前项目的最新进展,并回答了社区的提问。Midjourney7.0版本Holz更新了Midjourney7.0版本时间表,表示将会在未来1-2月内发布。让更多人体验MidjourneyHolz表121 0 2024-09-13 07:39
-
AI 美女全军覆没:赛博照妖镜下集体变“鬼”,AI 代码拆台 AI 生图
赛博照妖镜下,AI美女全变鬼。来看它的牙。把图像饱和度拉满,AI人像的牙齿就会变得非常诡异,边界模糊不清。整体图片的颜色也正常,麦克风部分更是奇怪。对比真实人类照片,则应该是这样的。牙齿是清晰的,图片色块都是均匀一致的。这个工具已经开放,人人都能拿着照片去试试。AI生成视频中的某一帧,也难逃此大法。不漏牙的照片也会暴露问题。不过BTW,这个工具出自Claude之手。用AI破解AI,奇妙的闭环。有一82 0 2024-08-12 12:39
-
“疑似 AI 合成作品”获摄影比赛三等奖?组织方工作人员:已取消其入选获奖资格
IT之家7月31日消息,据《南方都市报》报道,近期有多名网友反映四川省摄影家协会网季赛“寻觅‘绿色’”获奖名单中,三等奖获奖作品《层峦叠嶂》疑似为AI合成。而今天,参与组织该比赛的工作人员在采访中表示,质疑的作品已被取消其入选获奖资格;无独有偶,四川省摄影家协会的官方微信公众号也已经撤下了该作品。IT之家附该作品图:卷入此次“AI合成”争议的《层峦叠嶂》原为三等奖作品,有人质疑其“太过工整”,“可116 0 2024-07-31 15:18
-
腾讯混元 DiT 文生图大模型开源 6G 小显存版本,一同开源打标模型
IT之家7月4日消息,腾讯混元文生图大模型(混元DiT)今日宣布开源小显存版本,仅需6G显存即可运行,对使用个人电脑本地部署的开发者比较友好。此外,腾讯宣布混元文生图打标模型“混元Captioner”正式对外开源。该模型支持中英文双语,针对文生图场景进行专门优化,可帮助开发者快速制作文生图数据集。腾讯混元DiT模型升级腾讯混元DiT模型宣布了三大更新:推出小显存版本与Kohya训练界面,并升级至1129 0 2024-07-04 18:54
-
快手上线自研文生图大模型“可图”,消息称参数规模达十亿级
IT之家5月30日消息,快手自研文生图大模型“可图”已于近日正式对外开放,其目前支持文生图和图生图两类功能,可用于AI创作图像以及AI形象定制。用户可通过“可图”微信小程序和网页版使用。据界面新闻报道,这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称,“可图”大模型的参数规模达十亿级,这些数据来自开源社区、快手内部构建和自研AI技术合成,覆盖了常见的千万级中文实体概念,还引入强化145 0 2024-05-30 22:57
-
腾讯混元文生图大模型对外开源:搭载首个中英双语 DiT 架构,免费商用
IT之家5月14日消息,腾讯宣布旗下的混元文生图大模型升级并对外开源,目前已经在HuggingFace及Github上发布,包含模型权重、推理代码、模型算法等完整模型,可供企业与个人开发者免费商用。▲混元文生图效果▲ 混元长文生图效果升级后的混元文生图大模型采用了与Sora一致的DiT架构,腾讯表示,混元DiT是首个中英双语DiT架构。混元DiT是一个基于Diffusiontransfo173 0 2024-05-14 17:02
-
谷歌 Imagen 2 新增文生动图功能:可创作 4 秒动态图片,每秒 24 帧
IT之家4月9日消息,谷歌今日宣布,其AI工具Imagen2将新增“文生动图”功能,用户可通过输入文本生成类似GIF的动态图片。据介绍,该功能可生成4秒的动态图片,这些图片以每秒24帧的速度呈现,分辨率为360x640,支持镜头视角调整。谷歌还表示,Imagen在未来增加更多增强功能。为减轻人们对制造深度伪造(deepfake)图像的担忧,Imagen2将采用谷歌Deepmind开发的SynthI140 0 2024-04-09 20:33
-
“文生图”再升级!学习个性化参照,无限生成多样图片,轻松设计玩具建筑
新智元报道 编辑:LRS【新智元导读】将图片集反演到语义空间的分布,生成多样个性化图片或3D渲染,支持灵活文本编辑、多样性控制、概念混合等。最近,来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。这种方法可以让任何基于文字提示的生成模型(比如文生图、文生3D等),通过一组参照图片来学习对应的视觉属性共性和变化的文174 0 2024-01-16 23:42