Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了309,747,308字

标签 > 标签文章：#文生图# (共有9文章)

神秘模型“小熊猫”一夜刷屏：排名超 Flux、Midjourney

一夜之间，名为“red_panda” （小熊猫）的神秘文生图模型狠狠火了！！登顶文生图竞技场，直接将Flux、Midjourney等一众顶尖模型踩在脚下——其ELO得分比Flux1.1Pro高出100多，胜率高达79%，每7秒就能生成一张图像。生成效果belike：啥概念呢？按网友的话说，这家伙搁这跳级呢！这与从Flux1schnell到Flux1.1Pro的跳跃相同除了强得可怕，red

81 0 2024-10-29 13:42
文生图 AI Midjourney 雄心：7.0 版未来 1-2 月登场、开发新图像编辑器、探索 3D 系统、踏足硬件领域

IT之家9月13日消息，科技媒体TheDecoder昨日（9月12日）发布博文，报道称在最近的“OfficeHours”活动中，Midjourney创始人兼首席执行官DavidHolz在Discord分享了当前项目的最新进展，并回答了社区的提问。Midjourney7.0版本Holz更新了Midjourney7.0版本时间表，表示将会在未来1-2月内发布。让更多人体验MidjourneyHolz表

121 0 2024-09-13 07:39
AI 美女全军覆没：赛博照妖镜下集体变“鬼”，AI 代码拆台 AI 生图

赛博照妖镜下，AI美女全变鬼。来看它的牙。把图像饱和度拉满，AI人像的牙齿就会变得非常诡异，边界模糊不清。整体图片的颜色也正常，麦克风部分更是奇怪。对比真实人类照片，则应该是这样的。牙齿是清晰的，图片色块都是均匀一致的。这个工具已经开放，人人都能拿着照片去试试。AI生成视频中的某一帧，也难逃此大法。不漏牙的照片也会暴露问题。不过BTW，这个工具出自Claude之手。用AI破解AI，奇妙的闭环。有一

82 0 2024-08-12 12:39
“疑似 AI 合成作品”获摄影比赛三等奖？组织方工作人员：已取消其入选获奖资格

IT之家7月31日消息，据《南方都市报》报道，近期有多名网友反映四川省摄影家协会网季赛“寻觅‘绿色’”获奖名单中，三等奖获奖作品《层峦叠嶂》疑似为AI合成。而今天，参与组织该比赛的工作人员在采访中表示，质疑的作品已被取消其入选获奖资格；无独有偶，四川省摄影家协会的官方微信公众号也已经撤下了该作品。IT之家附该作品图：卷入此次“AI合成”争议的《层峦叠嶂》原为三等奖作品，有人质疑其“太过工整”，“可

116 0 2024-07-31 15:18
腾讯混元 DiT 文生图大模型开源 6G 小显存版本，一同开源打标模型

IT之家7月4日消息，腾讯混元文生图大模型（混元DiT）今日宣布开源小显存版本，仅需6G显存即可运行，对使用个人电脑本地部署的开发者比较友好。此外，腾讯宣布混元文生图打标模型“混元Captioner”正式对外开源。该模型支持中英文双语，针对文生图场景进行专门优化，可帮助开发者快速制作文生图数据集。腾讯混元DiT模型升级腾讯混元DiT模型宣布了三大更新：推出小显存版本与Kohya训练界面，并升级至1

129 0 2024-07-04 18:54
快手上线自研文生图大模型“可图”，消息称参数规模达十亿级

IT之家5月30日消息，快手自研文生图大模型“可图”已于近日正式对外开放，其目前支持文生图和图生图两类功能，可用于AI创作图像以及AI形象定制。用户可通过“可图”微信小程序和网页版使用。据界面新闻报道，这也是快手首次将其自研的系列大模型对外开放。报道援引知情人士消息称，“可图”大模型的参数规模达十亿级，这些数据来自开源社区、快手内部构建和自研AI技术合成，覆盖了常见的千万级中文实体概念，还引入强化

145 0 2024-05-30 22:57
腾讯混元文生图大模型对外开源：搭载首个中英双语 DiT 架构，免费商用

IT之家5月14日消息，腾讯宣布旗下的混元文生图大模型升级并对外开源，目前已经在HuggingFace及Github上发布，包含模型权重、推理代码、模型算法等完整模型，可供企业与个人开发者免费商用。▲混元文生图效果▲ 混元长文生图效果升级后的混元文生图大模型采用了与Sora一致的DiT架构，腾讯表示，混元DiT是首个中英双语DiT架构。混元DiT是一个基于Diffusiontransfo

173 0 2024-05-14 17:02
谷歌 Imagen 2 新增文生动图功能：可创作 4 秒动态图片，每秒 24 帧

IT之家4月9日消息，谷歌今日宣布，其AI工具Imagen2将新增“文生动图”功能，用户可通过输入文本生成类似GIF的动态图片。据介绍，该功能可生成4秒的动态图片，这些图片以每秒24帧的速度呈现，分辨率为360x640，支持镜头视角调整。谷歌还表示，Imagen在未来增加更多增强功能。为减轻人们对制造深度伪造（deepfake）图像的担忧，Imagen2将采用谷歌Deepmind开发的SynthI

140 0 2024-04-09 20:33
“文生图”再升级！学习个性化参照，无限生成多样图片，轻松设计玩具建筑

新智元报道编辑：LRS【新智元导读】将图片集反演到语义空间的分布，生成多样个性化图片或3D渲染，支持灵活文本编辑、多样性控制、概念混合等。最近，来自南加州大学、哈佛大学等机构的研究团队提出了一种全新的基于提示学习的方法——DreamDistribution。这种方法可以让任何基于文字提示的生成模型（比如文生图、文生3D等），通过一组参照图片来学习对应的视觉属性共性和变化的文

174 0 2024-01-16 23:42