Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,789,886字

该文章投稿至Nemo社区   资讯  板块 复制链接


直播版 Deepfake 实现单张照片实时视频换脸,5 分钟安装不挑硬件

发布于 2024/08/10 12:51 86浏览 0回复 2,766

马斯克“最新直播”,不好好扣他那 polo 衫扣子,拿个手机打光晃来晃去。看他脑袋左转右转,嘴角扬起的微笑,ak 都压不下去。

Why 啊?!

答案揭晓 —— 这活灵活现的马斯克,根本不是马斯克本马!

而是一个最新 AI 换脸项目生成的:

只需一张照片,就能换脸搞直播

不得不说,这样的马斯克还挺吓人的,有点鬼片怪蜀黍内味了~

本地安装一下,就能达到实时无延迟,还支持实时预览。

也就是说,无论搞在线会议还是直播带货,可以用任何人的脸了。

一打开会议软件,30 个马斯克正在开视频会议;一打开直播间,100 个董宇辉在发大额优惠券。

这个项目,叫做 Deep-Live-Cam,无需专用硬件加速。

虽然 AI 换脸已经不是新鲜事,但因为“1 张照片就能偷走你的脸去直播”,效果贼好,还被开源 —— 项目一下就火了。

直奔 GitHub 热榜第一,24 小时狂澜 1600 + 星。

围观网友中,激动者有之:

笑不活了,以后我参加任何视频会议,再也不用本人出席了哈哈哈哈哈哈!

也有人连连感慨,连老人都能用 AI 直播挣钱的时代终于降临,这一天来得太快就像龙卷风:

想过这一天会来,但没想过它来得这么快!

实时换脸直播造假

你有看过马斯克穿着汗衫在出租屋的场景吗?

“马斯克”一本正经盯着屏幕

这个项目一出,大家都开始疯玩了起来,目前 GitHub 已累计 5300 + 星。(注意看,简介里还特意注明未经审查)

比如这位网友带来 repo,对它给予了高度的评价。

它的工作几乎完美无瑕,而且完全是实时的。我只花了 5 分钟就完成了安装。

之所以安装这么快,在后面他也透露了自己计算配置,确实很顶了。

他换脸胡子拉碴的小扎扎克伯格,或许他老了之后就变成这样了吧。

随后摇身一变,变身成了帅气大叔乔治克鲁尼,但嬉皮笑脸版。

还有休格兰特。

相信细心的朋友也看出来了,为啥这三位的发型和胡子都一样。

这应该也是这款软件的一个小 bug:发型不能轻易改变,胡须也很难隐藏。

因此它无法解决一些秃头的需求 —— 没办法通过换脸长出头发……

也是注意到这个软件背后存在的风险,作者在项目最开始就特此声明。

首先,这款软件旨在为人工智能 media 行业做出贡献,去帮助一些博主啊什么的完成一些任务,比如制作自定义角色的动画、将角色用作服装模特等。

为了避免一些不道德的应用,它有个内置检查功能,可防止程序处理一些不适当的内容。

作者也坦言,未来项目也可能关闭或者在输出结果上添加水印。并建议大家如果使用的是真人面孔,建议征得当事人的同意,并在网上发布内容时明确说明这是 DeepFake 的。

随后作者分享了食用技巧。他首先表示,他在本地计算机(CPU)更有可能运行,但速度会非常慢。

简单四个步骤:首先进行一些配置:python (3.10 版本推荐);pipgit;ffmpe;visual studio 2022 runtimes (windows);克隆存储库,然后下载两个模型:GFPGANv1.4 和 inswapper_128_fp16.onnx,并将其放到 models 这个文件夹中。

最后再安装依赖项;如果想使用 GPU 加速,作者也进一步提供了操作指导。

安装完成之后就可以进行使用啦~ 不过首次运行时会下载一个大约 300M 的模型。

如图所示,选择一张脸的图像以及目标图像 or 视频,然后点击 Live

这个项目的前身叫做 roop-cam,拍摄一段视频,用你选择的人脸替换其中的人脸。

您只需要准备一张所需人脸,比如寡姐的图像。整个过程无需数据集,无需训练。

同样也支持 Live 模式。

几乎无法区分的照片级真实感

随着开源时间渐长,开发者和围观网友们的讨论也日益增多。

不少人认为这很“crazy”,因为操作门槛这么低、效果这么好的项目,它居然开源了。

另一群认为这很“crazy”的人,则是忧心忡忡,觉得这个世界更加真假难辨了。

后者担心的问题,显然摆在我们每一个人眼前。

AI 换脸 —— 无论是直播、视频会议还是图片、语音,都是现在网络冲浪的各位,需要瞪大眼睛仔细辨别的。

就拿近期 AI 绘画届,最新顶流 FLUX 来说吧!

这是 Stable Diffusion 原班人马官宣创业的第一个项目,连 AI 大神卡帕西都激情转发表达对其效果的赞赏。

不管是手还是文字,效果都很真实,很震撼。

FLUX 生成的“照片”

于是有推友,用 FLUX、可灵等 AI 生成工具,做了一个 100% AI 的油管主播。

网友看了直流泪,“AI 为什么生成得这么逼真,难道我们是不知道真人长啥样嘛。”

难怪有人感慨,这难道就是传说中的“硅谷遇上恐怖谷”?

以后的互联网,一定是超奇怪的地方…… 虽然现在就已经很奇怪了啊啊啊啊啊呜呜呜呜呜。

对此,量子位只能说 ——

那如果,再加上这个口型同步模型 ReSyncer 呢?(对,这有一个狗头)

ReSyncer 放出了自己和 Heygen 在唇形同步效果上的对比:霉霉再现说中文神技。

观感是什么?

大概或多或少都和这位推友有共鸣:

AI 技术让真・后真相时代到来了。

说到这儿就不得不放个近期的新闻:

3 天前(8 月 7 日),湖北黄石市公安局下陆分局对外公布,破获了一起用 AI 换脸技术解冻社交账号并倒卖获利的案件。

三名男子把一些视频进行 AI 换脸,然后用换脸后的动态面部,来解冻一些已被平台冻结了的账号。

最终,他们仨利用 AI 换脸,解锁了 2000 余个社交账号,非法获利超 40 万元。

谁说 AI 带来的诈骗风险,只来自于直接换脸呢?

但 AI 生成、AI 换脸走向几乎无法区分的照片级真实感,已经是大势所趋。

怎么办?!

已经有人坐不住了,在讨论区表示,正在针对渲染时的编解码器,开发一个深度伪造检测插件。

让我们为 ta 加油吧……

参考链接:

  • [1]https://github.com/trending

  • [2]https://www.reddit.com/r/singularity/comments/1eo4sne/single_image_to_live_stream_deep_fake_deeplivecam/

  • [3]https://x.com/levelsio/status/1822067118914879808

本文来自微信公众号:微信公众号(ID:QbitAI),作者:关注前沿科技

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/787/583.htm]

本文标签
 {{tag}}
点了个评