Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,806,742字

该文章投稿至Nemo社区   资讯  板块 复制链接


AI 超清修复张国荣《热・情》演唱会,22 年前人物面部和舞台极度还原,歌迷泪奔

发布于 2022/04/02 15:01 394浏览 0回复 1,479

感谢IT之家网友 Sancu菜狗 的线索投递!

AI 超清修复了张国荣《热・情》演唱会。无数粉丝聚集在手机电视屏幕前重温那场经典。这便是昨晚,在张国荣辞世 19 周年纪念日所上演的一幕:可以看到前后对比明显,修复后的张国荣脸部、舞台等细节清晰可见。

作为张国荣生前最后一场,它的反响空前绝后,是无数歌迷心中的经典之作。在听说腾讯修复了这场演唱会之后,有粉丝激动地表示“高兴地吃不下饭”。在昨晚的现场直播中,不少歌迷更是直言泪奔:“感谢 AI 修复师们的努力,我们好像瞬间回到了 22 年前的舞台现场,得以再次感受哥哥的绝代风采。”

修复这场演唱会有什么难点?

修复历史影像作品甚至残损影像,对于腾讯多媒体实验室来说挑战并不大。他们已经参与过《康熙王朝》、《天下人家》等多部经典影视剧的高清修复工作。而这次的唱片公司宝丽金珍藏的《热・情》演唱会母带和网上流传的视频,画质也是普遍欠佳。但其中最大的难点还是演唱会视频中的色彩、画面切换太快。

如何才能给观众带来融入其中的沉浸感体验,最大限度地还原原视频的清晰度?来自腾讯的修复师们一共用了四大步:智能分析、画质修复、画质增强和智能编码。

具体来说,首先要利用多种智能评估算法对视频内容进行全方位、多维度分析,评估视频的运动和纹理复杂度、压缩失真程度等。

得到分析结果后,再利用画质修复模块的多种智能算法(腾讯自研),修复各类破坏画质的主要因素,包括但不限于划痕、竖线、雪花点、噪声、压缩失真、抖动等问题。

这其中比如划痕修复就存在诸多难点。一方面划痕修复不可逆且成本高昂;另一方面目前缺少庞大的划痕公开数据库,算法难以调优,建设成本也非常昂贵。为此,实验室专门设计了针对性的多方向数据增广方案。方案包括划痕的裁切及合并、随机尺寸、随机模糊程度、局部及全局随机亮度调整、随机透明度调整等。

紧接着,画质增强模块便会选择最佳视频增强算法,对画面进行多维度画质提升,在空间和时间上提升视频的分辨率和帧率,在空域上提升细节清晰度、色彩丰富度。这其中需要驾驭和平衡 CNN (卷积神经网络) 和 GAN (生成对抗网络) 两种智能算法。

CNN 是经过大量图像数据训练而成的熟练工”,它修复的结果比较真实,但有时细节会不够丰富;而 GAN 经过自我博弈成长而来,它修复的结果更为丰富细腻,但有时会显得不太真实。在完成视频修复及画质增强后,智能编码模块可以通过自适应编码在减少输出文件大小、视频传输成本的同时,保证视频的主观质量不受影响,实现最佳的画面效果。

从歌迷们的反响来看,最终呈现的效果可以说是让他们感到非常满意。

不少人还表示:

“可不可以把告别演唱会和 98 年的那场也修复了?真的好期待。”

关于腾讯 AI 修复实验室

腾讯多媒体实验室,是腾讯旗下的多媒体通信和处理研发团队,专门研究多媒体数据传输与压缩、智慧融合媒体、互动沉浸式媒体领域的技术与产品化。

实验室的总经理则是刘杉博士,她是腾讯首位女性杰出科学家、IEEE Fellow,也是全球音视频领域的技术带头人。

刘杉博士本科毕业于清华大学电子工程系,硕士和博士毕业于美国南加州大学,研究方向包括音视频、沉浸式和新兴多媒体 VR / XR 等的压缩、处理、传输、系统和智能化应用。

在刘杉博士的带领下,腾讯多媒体实验室也多次参与国际国内行业标准制定,包含多媒体数据压缩,多媒体传输、系统与 5G,以及多媒体 AI 等。

自 2018 年参与 H.266 / VVC 标准制定以来,该实验室已有超过 500 项提案被多个国际标准采纳。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/611/053.htm]

本文标签
 {{tag}}
点了个评