Echo

关注TA

大家好，我是Echo！

普罗旺斯
自由职业
写了289,940,074字

该文章投稿至Nemo社区资讯板块复制链接

谷歌文本转图像人工智能模型 Imagen 首次公开亮相

发布于 2022/11/03 09:13 202浏览 0回复 882字

IT之家 11 月 3 日消息，谷歌在发布其文本转图像的人工智能系统方面极为谨慎，尽管该公司的 Imagen 模型产生的输出质量与 OpenAI 的 DALL-E 2 或 Stability AI 的 Stable Diffusion 相当，但谷歌此前并没有将该系统向公众开放。

不过今天，这家搜索巨头宣布将把 Imagen 以非常有限的形式添加到其 AI Test Kitchen 应用中，作为一种收集关于该技术的早期反馈的方式。

AI Test Kitchen 是在今年早些时候推出的，目的是对谷歌的各种 AI 系统进行测试。目前，该应用程序提供了一些不同的方式与谷歌的文本模型 LaMDA 进行互动，该公司很快将增加类似的限制性 Imagen 请求，作为其所谓的应用程序“第二季”更新的一部分。简而言之，将有两种方式与 Imagen 互动：城市梦想家和 Wobble。

在“城市梦想家”中，用户可以要求模型生成围绕他们选择的主题设计的城市元素，例如，南瓜、牛仔布。Imagen 创建了样本建筑和地块（城市广场、公寓楼、机场等等），所有的设计都以类似于在《模拟城市》中看到的等距模型出现。

A screenshot of an App interface with an AI image generation model that creates pictures of imaginary cities.

The “City Dreamer” task lets users request themed city buildings in isometric designs.

在 Wobble 中，你可以创造一个小怪物。可以选择它的材质（粘土、毛毡、杏仁糖、橡胶），然后给它穿上你选择的衣服。该模型会生成你的怪物，给它起个名字，然后你可以戳戳它，让它“跳舞”。

The “Wobble” feature lets users design a monster and make it dance.

IT之家了解到，与其它文本到图像的模式相比，这些互动是非常受限制的，用户不能随便创造他们喜欢的东西。不过，这也是谷歌有意为之。谷歌产品管理高级总监乔希-伍德沃德（Josh Woodward）解释称，AI Test Kitchen 的全部意义在于：a）获得公众对这些 AI 系统的反馈；b）测试哪些行为会使得系统崩溃。

不过最大的问题是，谷歌是否会想把这些模型推向更广泛的公众，会采取什么形式？目前，该公司的竞争对手 OpenAI 和 Stability AI 正急于将文本-图像模型商业化，谷歌是否会觉得自己的系统足够安全，可以走出 AI Test Kitchen 提供给用户？

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/650/836.htm]

本文标签
人工智能谷歌 ai

上一个文章：荣耀 Magic 5 系列曝光：搭载高通骁龙 8 Gen2，定制准高分护眼屏 + 超超大底主摄

下一个文章：特斯拉 2022.36.6 软件版本更新面向国内车主推送，动能回收补偿、驾驶室过热保护来了