Echo

关注TA

大家好，我是Echo！

加入社区2,199天
写了311,239,362字

该文章投稿至Nemo社区资讯板块复制链接

清华首个虚拟学生华智冰露脸唱歌，小冰公司：实现完全虚拟生成不存在的面部

发布于 2021/09/30 08:26 602浏览 0回复 1,570字

IT之家 9 月 30 日消息近日清华虚拟学生华智冰弹唱歌曲的视频走红网络，这也是团队首次发布其正面露脸视频。华智冰是由清华大学计算机系、北京智源研究院、智谱 AI 和小冰公司联合培养，是中国首个原创虚拟学生，已在清华园里开启学习和研究生涯。

清华首个虚拟学生华智冰露脸唱歌，小冰公司：实现完全虚拟生成不存在的面部

小冰公司对此发表了声明，声明中小冰解释了华智冰项目的初衷：希望能够以智能模型作为核心，试验预训练模型能够带来哪些技术与应用方面的惊喜。

小冰公司在声明中还称，新的产品化技术实现了完全虚拟生成不存在的面部，且具有足够丰富的 features，从而能够实现精度更高的视觉化交互内容。视频中人物的面部特征，包括人脸、表情、口型等，全部由人工智能小冰框架 X Avatar 生成并进行融合；视频中的人物肢体、动作，包括手持吉他弹唱，来源于小冰团队成员鱼子酱酱录制的原始视频模版。视频中的歌声，由人工智能小冰框架 X Studio 生成。

据悉，华智冰将师从清华大学唐杰教授，即日起开启在清华大学的学习和研究生涯。

IT之家了解到，华智冰是由清华大学计算机系、北京智源研究院、智谱 AI 和小冰公司联合培养，可以作诗作曲，生成图画，还将具有一定的推理和情感交互的能力，而她来到清华的第一年将通读“天下书”，不断地为其输入各种语料；第二年进入“精读”阶段，引导华智冰对语料背后的逻辑有更深刻的理解；第三年则培养她的创造力，从此有望在多项认知智能上超过人类。华智冰智商和情商双高，可以作诗、作画、创作剧本杀，还具有一定的推理和情感交互的能力。不同于一般的虚拟人物，华智冰背后依托的是中国“悟道”超大规模人工智能模型。

以下为小冰公司的具体声明：

随着视觉化交互内容（如短视频）的不断深化，对于人物出镜交互的需求越来越多。但是，由于人类的行为存在各种不稳定性，常常给商业机构和品牌方带去很大的风险与不确定性。对此，越来越多的商业机构、内容制作方与品牌方，呼唤一种安全可控的虚拟人类内容（含商业代言）产品化技术。

但是，已往付诸产品化的技术存在诸多问题：它无法像真实人类一样，生成足够丰富的面部 features，且无法打通生成与替换的端到端流程。因此，只能实现真实人类面部间的替换，精度质量不足。

更严重的问题是，以往的方法无法从根源上避免隐私侵权风险。

新的产品化技术实现了完全虚拟生成不存在的面部，且具有足够丰富的 features，从而能够实现精度更高的视觉化交互内容。尤其是，由于从根源上避免了使用任何真实人类面部的可能性，有效阻断以往技术无法避免的隐私侵权问题。从隐私角度，是一个重要的进步。

我们相信，虚拟人将成为未来视频内容的主要提供者之一，而安全、可控、无隐私风险和侵权风险是其前提。因此，小冰一直在这一趋势方向上进行探索，并从不同方面对这一领域做拓展研究。小冰与清华大学计算机系合作华智冰项目，正是在预训练模型方面进行合作，希望能够以智能模型作为核心，试验预训练模型能够带来哪些技术与应用方面的惊喜。

这次传播的视频，来自小冰发布会的进展汇报展示，为华智冰能力续写了一些新的进展，demo 小冰框架下最新的面部生成和 3D 视频封装技术成果。具体来说：视频中人物的面部特征，包括人脸、表情、口型等，全部由人工智能小冰框架 X Avatar 生成并进行融合；视频中的人物肢体、动作，包括手持吉他弹唱，来源于小冰团队成员鱼子酱酱录制的原始视频模版。视频中的歌声，由人工智能小冰框架 X Studio 生成。

除此之外，华智冰除了 3D 面部生成，以及歌声合成的优化，还有其他很多更底层的、涉及数字人“大脑”的新技术应用，例如在有机融合了知识图谱和预训练模型后，可以让数字人有常识和推理能力。华智冰正在不断“成长”中，还会有更多最新技术的应用，敬请期待。

小冰公司

2021 年 9 月 29 日

本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/578/456.htm]

点了个评