AI 绝对可以称得上是这几年最火爆的话题。从 Alpha Go 击败顶尖围棋选手开始,越来越多人意识到在很多领域,AI 已经能够用接近人类的思维,更高效地完成任务。在很多领域,AI 甚至已经可以涉及甚至部分取代之前只能由人类担任的工作,例如机器翻译有了 AI 加持后,译文的质量在很多场景下已经达到了可用的程度,电脑和互联网变得越来越聪明了。
▲ AI 加持的翻译 GNMT 比之前的 PNMT 更加接近人工翻译
然而长久以来,很多人依然认为,在一些体现人类独创性思维的领域,仍是 AI 的禁区。例如艺术和绘画,很难想象出 AI 能和人的想象力和手艺一较高下。
但是,近年 AI 在图形学的进展,却让人惊呼时代真的变了!不少高质量的 AI 绘画方案纷纷面世,即使你完全不会画画,凭借着寥寥几笔涂鸦,甚至简单一两句乃至几个词的描述,就能够通过 AI 生成美轮美奂的绘画,简直如同黑科技,尤其是最近在 Google Colab 开源的 Disco Diffusion,全世界都玩疯了!
▲ Disco Diffusion 已经可以绘制如此高质量的图画了!
AI 绘画并不是一蹴而几的,它随着算力的增强,以及算法的完善,慢慢修炼到了如今的功力。那么在这几年,都有些什么令人印象深刻的 AI 绘画方案?今天,就来介绍一些相当值得把玩的 AI 绘画,来看看 AI 在如何一步步在艺术领域挑战人类的吧。
Paintschainer
这可能是最早出圈的 AI 绘画方案了。Paintschainer 在早几年就引起了人们的注意,它并不能完全靠自己来画一幅画,Paintschainer 的主要作用是给线稿上色,其效果已经可以追上一些比较简陋的人工上色作品。
Paintschainer GitHub 主页:https://github.com/ pfnet / PaintsChainer
Paintschainer Demo:https://petalica-paint.pixiv.dev/index_zh.html
Paintschainer 在当时之所以突然爆火,是因为人们突然发现,AI 居然是可以辨认线稿内容的!Paintschainer 的惊人之处,在于它能够识别线稿的内容,例如一张美少女人像,它可以识别某部分属于皮肤,某部分是头发,某部分是衣服,某部分是背景,然后分别涂上适当的颜色。不仅如此,它的上色范围还相当精准,尽管线稿没有封闭,但颜色依然会保留在适当的范围,而不会涂得满地都是 —— 用过 PS 中油漆桶工具上色的朋友,应该知道这是什么意思。
▲ AI 可以分辨对于电脑来说很抽象的线稿,并自动上色
▲ 使用简单的彩色线条作颜色指定 ho 后,上色更精确,效果甚至已经和人工上色不相上下了
在很多人的固有认知中,电脑很难“理解”图像,从照片中辨认、总结出内容物是什么。然而 Paintschainer 却做到了更高的层次,能够“理解”线稿这样比起写实照片更加抽象的图像。尽管 Paintschainer 并不完美,但它已经足以让人们对于 AI 的强大有了更加贴切的体验。
NV GauGAN
NV 是显卡界的大拿,无数游戏玩家将老黄视为偶像。而 NV 同样是 AI 算力的重要贡献者,它早早在 AI 领域布局了多枚棋子,到如今 NV 在 AI 领域无论是硬件还是配套的软件,都达到了很高的水平 —— 游戏玩家如果用过 NV 增强画质的 DLSS AI 算法,一定深有体会。
DLSS 并非是 NV 在图像 AI 领域的唯一体现,实际上,NV 近年的一个开源 AI 项目 SPADE / GauGAN,就让人啧啧称奇。
NV SPADE GitHub 主页:https://github.com/ NVlabs / SPADE
NV GauGAN 2 Demo:http://gaugan.org/gaugan2/
GauGAN 是一个 NV 使用 AI 生成图像的方案,和上文介绍的线稿上色 AI 相比,GauGAN 的强大之处就在于它可以生成完成度极高的图像,而前提是只需要你涂抹几笔,用不同颜色的色块和线条意思一下,GauGAN 就可以明白你的意思,还你一张逼真度极高的照片。
而 GauGAN 一直处于发展中。今年,GauGAN 还推出了第二代,除了依然可以通过简笔画生成照片,现在还能够通过文字描述来生成图像了!
在 GauGAN 2 当中,用户只需要输入描述画面的文字,AI 就可以自动生成对应的画面。而且,生成的速度非常惊人,几乎就是即时的。例如下图,输入“Ocean”出现海,继而输入“waves”则会出现波浪,继续输入“hitting rocks on the beach”则又继续生成海滩和岩石,效果非常惊人。
此外,GauGAN 还支持用户手动涂抹修改。如果想要对生成的内容做调整,就可以直接用简笔涂鸦,AI 会如魔法般变出逼真的对应内容。
GauGAN 之所以有如此大能,是因为使用了对抗网络,大量数据经过机器训练后,使用生成器和鉴别器来识别对应元素,从而匹配数据生成图像。据了解,GauGAN 2 使用了 1000 万张图像进行训练,艺术家使用它不仅可以生成现实的风景,还可以生成天马行空的艺术场景,这超越了很多人以往对电脑插手艺术的固有印象。
Disco Diffusion
这可能是今年最为人瞩目的绘画 AI 了!Disco Diffusion 一经面世,就刷爆了全球各大社交媒体,它颠覆了很多人对 AI 的认知。
▲ 你敢相信,这是 AI 作出来的画?
如果说 GauGAN 的强大之处,在于可以凭借人的简单想象就生成逼真图像,那么 Disco Diffusion 就更进一步,不仅可以进行复杂的想象,而且还可以生成各种画风的绘画!
Disco Diffusion 是一个运行在 Google Colab 上的 AI,如果要使用它,需要拥有 Google 账号并且能访问 Google,国内的用户可以自行解决这方面的问题。Disco Diffusion 的程序是面向公众公开的,在使用之前,我们可以先将其保存到自己的 Google Drive 网盘,以方便进一步的编辑。
Disco Diffusion:https://colab.research.google.com/github/alembics/disco-diffusion/blob/main/Disco_Diffusion.ipynb
Disco Diffusion GitHub 主页:https://github.com/ alembics / disco-diffusion
Disco Diffusion 的强大之处,在于你给出一段描述文字,就能够生成高质量的画作。尽管它没有图形界面,但使用起来并不复杂,进入到“Setting”当中,可以设置名称(AI 生成的绘画会保存到 Google Drive 中对应的文件夹)、尺寸(不要设置太大,保持默认即可)、步数(保持默认即可)等等。
接着,进入到“Prompts”(提示词)的设置当中,这就是最关键的地方了。在 Prompts 中,你可以输入描述绘画的词句,例如官方给出的实例为“A beautiful painting of a singular lighthouse, shining its light across a tumultuous sea of blood by greg rutkowski and Thomas kinkade, Trending on artstation.”, “yellow color scheme””,意思大致为“奇异灯塔的美丽绘画,在汹涌的血海中闪耀着光芒,参考 greg rutkowskiThomas kinkade 的画风,以及 artstation 网站上流行的风格”“黄色主调”。
然后点击“代码执行程序”中的“全部运行”,静静等待即可。运算过程可能长达几十分钟乃至数小时,运算是在 Google 的云服务器上运行的,对本机电脑性能没要求。随后,Disco Diffusion 就生成了这样一副绘画!
在很多人眼里,AI 能够生成这样的一幅画是非常惊人的,其完成度甚至不属于一些真正的画手。而 Disco Diffusion 生成这样的一幅画,流程要比手工作画来得更快,而且改一下提示词,又能生成另外不同风格的画了。
▲ 同样的 Prompts 提示词,仅仅更换了作者风格的关键字,Disco Diffusion 就可以生成不同的画风
Disco Diffusion 对提示词的要求很宽松,完全可以用简单的词语,甚至是机翻来应对。例如笔者填入了“a modern city at night,super wide angle,artstation”这样简单的 Prompts,就生成了下面这幅画作。
Disco Diffusion 有很多潜力可发掘。例如使用算力更强的云服务、设置更多次的迭代算法、提供更具体的提示词、甚至给到参考图片,都能够生成更高质量、更多种风格的画作。下面是一些来自互联网的利用 Disco Diffusion 生成的作品,大家可以感受一下。
▲Prompts:The Vast Viridescent Hillside lacks Rationality and obfuscates its Beauty
▲Prompts:when you have taken everything away, what remains? will you walk this road all the way to the heart of the galaxy?
▲Prompts:forbidden aesthetic
毫无疑问,Disco Diffusion 的出现,颠覆了很多人的三观。这个 AI 所生成的绘画,甚至已经可以说拥有一定的艺术感了。尽管它对于动物和人物的绘制仍存在短板,而且也并不能胜任人物、场景设计这样具体的、需要扣细节的工作,但无论是给普通人一场视觉盛宴,还是给行业人员找找灵感,都已经绰绰有余了。
可以说,Disco Diffusion 将绘画 AI 推向了一个新高度,绘画这种讲究审美、讲究灵感的技艺,也不再专属于人类了。
Tiamat
Disco Diffusion 依托在 Google Colab 上,对于国内用户来说有网络方面的门槛,而且界面说不上易用,还需要用英文来撰写提示词(尽管可以机翻)。现在,对国人更友好的 AI 绘画方案,正在路上。
最近,一款名为 Tiamat 的绘画 AI 在国内展开了测试。根据内测者微博用户 @春卷 的体验反馈,它的界面比较友好,而且可以用中文来给 AI 命题,效果还相当不错。
和 Disco Diffusion 相比,Tiamat 的本土化做得好很多。例如,它甚至能根据诗词来绘画,画面效果相当好,还颇有意境。在微博、小红书平台上,都可以找到很多这样的案例。
▲ Prompts:天苍苍,野茫茫,风吹草低见牛羊(来自微博 @春卷)
▲ Prompts:海压竹枝低复举,风吹山角晦还明(来自小红书 @青柑普洱不甜_Tiamat)
▲ Prompts:帘卷落花如雪,烟月,谁在小红亭(来自小红书 @5+1=6)
可见,Tiamat 的 AI 方案还是有吸引人的独到之处的。不过目前 Tiamat 目前仍处于内部测试阶段,如果想要亲自体验,可以通过下面的链接来申请测试资格。
Tiamat 内测申请:https://tiamat-ai.feishu.cn/ share / base / shrcn2uXL8wNiveykIFYqWSzsPf
希望 Tiamat 能够尽快推出公开的版本,让更多国人感受到 AI 绘画的魅力吧。
总结
随着硬件性能的进步以及算法的改进,AI 仍在飞速发展。AI 在绘画方面的建树,已经让人咋舌,大家有条件的话,强烈推荐把玩一下 Disco Diffusion,感受 AI 作画的魅力。未来 AI 会在更多方面挑战人类的灵智吗?我们拭目以待吧。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/627/604.htm]