Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  • 加入社区2,199天
  • 写了311,239,362字

该文章投稿至Nemo社区   资讯  板块 复制链接


清华首个虚拟学生华智冰露脸唱歌,小冰公司:实现完全虚拟生成不存在的面部

发布于 2021/09/30 08:26 602浏览 0回复 1,570

IT之家 9 月 30 日消息 近日清华虚拟学生华智冰弹唱歌曲的视频走红网络,这也是团队首次发布其正面露脸视频。华智冰是由清华大学计算机系、北京智源研究院、智谱 AI 和小冰公司联合培养,是中国首个原创虚拟学生,已在清华园里开启学习和研究生涯

小冰公司对此发表了声明,声明中小冰解释了华智冰项目的初衷:希望能够以智能模型作为核心,试验预训练模型能够带来哪些技术与应用方面的惊喜。

小冰公司在声明中还称,新的产品化技术实现了完全虚拟生成不存在的面部,且具有足够丰富的 features,从而能够实现精度更高的视觉化交互内容。视频中人物的面部特征,包括人脸、表情、口型等,全部由人工智能小冰框架 X Avatar 生成并进行融合;视频中的人物肢体、动作,包括手持吉他弹唱,来源于小冰团队成员鱼子酱酱录制的原始视频模版。视频中的歌声,由人工智能小冰框架 X Studio 生成。

据悉,华智冰将师从清华大学唐杰教授,即日起开启在清华大学的学习和研究生涯。

IT之家了解到,华智冰是由清华大学计算机系、北京智源研究院、智谱 AI 和小冰公司联合培养,可以作诗作曲,生成图画,还将具有一定的推理和情感交互的能力,而她来到清华的第一年将通读“天下书”,不断地为其输入各种语料;第二年进入“精读”阶段,引导华智冰对语料背后的逻辑有更深刻的理解;第三年则培养她的创造力,从此有望在多项认知智能上超过人类。华智冰智商和情商双高,可以作诗、作画、创作剧本杀,还具有一定的推理和情感交互的能力。不同于一般的虚拟人物,华智冰背后依托的是中国“悟道”超大规模人工智能模型。

以下为小冰公司的具体声明:

随着视觉化交互内容(如短视频)的不断深化,对于人物出镜交互的需求越来越多。但是,由于人类的行为存在各种不稳定性,常常给商业机构和品牌方带去很大的风险与不确定性。对此,越来越多的商业机构、内容制作方与品牌方,呼唤一种安全可控的虚拟人类内容(含商业代言)产品化技术。

但是,已往付诸产品化的技术存在诸多问题:它无法像真实人类一样,生成足够丰富的面部 features,且无法打通生成与替换的端到端流程。因此,只能实现真实人类面部间的替换,精度质量不足。

更严重的问题是,以往的方法无法从根源上避免隐私侵权风险。

新的产品化技术实现了完全虚拟生成不存在的面部,且具有足够丰富的 features,从而能够实现精度更高的视觉化交互内容。尤其是,由于从根源上避免了使用任何真实人类面部的可能性,有效阻断以往技术无法避免的隐私侵权问题。从隐私角度,是一个重要的进步。

我们相信,虚拟人将成为未来视频内容的主要提供者之一,而安全、可控、无隐私风险和侵权风险是其前提。因此,小冰一直在这一趋势方向上进行探索,并从不同方面对这一领域做拓展研究。小冰与清华大学计算机系合作华智冰项目,正是在预训练模型方面进行合作,希望能够以智能模型作为核心,试验预训练模型能够带来哪些技术与应用方面的惊喜。

这次传播的视频,来自小冰发布会的进展汇报展示,为华智冰能力续写了一些新的进展,demo 小冰框架下最新的面部生成和 3D 视频封装技术成果。具体来说:视频中人物的面部特征,包括人脸、表情、口型等,全部由人工智能小冰框架 X Avatar 生成并进行融合;视频中的人物肢体、动作,包括手持吉他弹唱,来源于小冰团队成员鱼子酱酱录制的原始视频模版。视频中的歌声,由人工智能小冰框架 X Studio 生成。

除此之外,华智冰除了 3D 面部生成,以及歌声合成的优化,还有其他很多更底层的、涉及数字人“大脑”的新技术应用,例如在有机融合了知识图谱和预训练模型后,可以让数字人有常识和推理能力。华智冰正在不断“成长”中,还会有更多最新技术的应用,敬请期待。

小冰公司

2021 年 9 月 29 日


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/578/456.htm]

本文标签
 {{tag}}
点了个评