Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,701,885字

该文章投稿至Nemo社区   资讯  板块 复制链接


字节跳动公开深度学习新技术:随意变脸/照片会动,算量大幅减少

发布于 2021/09/19 15:54 453浏览 0回复 561

IT之家 9 月 19 日消息 今日字节跳动技术团队在其官方公众号发表文章,介绍了字节跳动的一项深度学习新技术。深度学习模型中的生成式对抗网络(GAN),可以用于图片风格迁移、图像编辑、图片生成等场景,为画面以及视频改变风格。

举例来看,该技术可以将一匹棕色的马变成斑马,或者将莫奈的风景画变成真实的照片。依据一个 鞋子的轮廓,可以自动生成真实的鞋子图形。

图片

图片

字节跳动表示,图片风格迁移、图像编辑、图片生成等场景。2020 年,麻省理工学院、Adobe 和上海交通大学技术人员提出一种 GAN 压缩算法,将算力消耗成功减少到 1/21。

最近,字节跳动技术团队推出了一项自研 GAN 压缩算法,名为“在线多粒度蒸馏技术”,简称 OMGD。这项算法能够极大降低 CycleGAN 和 Pix2Pix 模型的算力消耗,分别降至原来的 1/40 和 1/46。不仅参数和计算量更少,图像生成效果也更好

上图的结果显示,OMGD 消耗的计算量仅为 1.219G,相比于原始状态的 56.8G,计算量大幅减少,生成效果也更优。

IT之家了解到,目前 OMGD 技术已经应用在多款抖音智能特效中。比如“三屏人生”,可以将过去、现在、未来的自己实时展现在屏幕上。

使用动态照片功能,可以让静态画面动起来,表情丰富逼真。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/576/463.htm]

本文标签
 {{tag}}
点了个评