在今年结束的CES 2020上,三星首次对外展示其作品——NEON,“人工制造人”(Artificial Human),由三星旗下创新实验室STAR Labs独立开发。
STAR Labs现任首席执行官Pranav Mistry表示,NEON很人性化,因为是仿照人类设计的,但它们可以显示非常详细的表情和手势,甚至还能显示可以编程的新特征。
然而,在发布会后,NEON的“人工制造人”引起了很大的争议,部分人开始质疑其技术的真实性。
咨询公司CCS Insight的Ben Wood表示,看到NEON这些人物之后,“没什么印象”。他在推特上说,“在展台上,它们看起来就像‘演员的视频,可以被操纵来做某些动作’。我一定是错过了什么。”
J. Gold Associates的分析师Jack Gold表示,如果三星可以开发出能够表达情感和表情的虚拟人物,它可能会走在行业的前列。但他同时也对其被滥用的可能性提出了质疑,“它对很多领域都有重大影响,比如客户服务、娱乐方面,当然也可以用来‘伪装’一个人与真人互动,达到不良或非法的目的。”
一位英国工程师Mat Smith在engadget上发表了一篇文章,他认为,Neon的“人工制造人”是今年CES中第一个取得了“病毒式成功”的产品。Neon还向CES发布了一份新闻稿,其中充斥着夸张、复杂的机器学习术语,以及一份相当晦涩的使命宣言。Neons还指出有望实现“实时反馈”。于是,好奇心驱使着Mat Smith亲自去一探究竟。
Neon的创始人,STAR Labs首席执行官Pranav Mistry表示:“Neons将与我们的世界融为一体,并成为通往更美好未来的新纽带,在这个世界中,‘人类就是人类’和‘机器也是人类’。”这让它们听起来像是数字对话伙伴,在这种情况下,互动将接近真人。这家公司的使命似乎是与未来的虚拟助手建立一种更温和、更有同理心的联系,这听起来...不错。
要想弄清楚Neon是如何组合到一起并工作的,这很复杂,让我们慢慢来分析。Neon既是公司名称,又是这些“人工制造人”的称谓,它的技术核心可以分为两部分:Core R3和Spectra。
Core R3:“实时响应现实”
Core R3是“实时响应现实”的缩写,R3代表:Reality(真实)、Realtime(实时)和Responsive(回应)。这是生成这些“人工制造人”的外观和肢体运动方式的过程,目的是创建“超越正常感知的现实”。它将专利技术与神经网络相结合,创造出了这些“人工制造人”,尽管他们是在真人的基础上构造出的。
在CES上演示的“人工制造人”都是基于真实的人,但是据该公司称,手势和表情是独立生成的。
我们看到的早期Neon的视频流畅而逼真,令所有人为之惊叹。那是因为他们实际上只是人类的视频。在展台上,Neon在每个屏幕的底部都刻上了他们真人大小的头像,上面几乎没有免责声明。这些只是对未来“人工制造人”外观和行为的设想。当然,Core R3的实际结果看起来很有希望,但与大多数人希望看到的结果依然相去甚远。
Core R3被“广泛训练”来研究人类的外表、行为和相互作用,这就是神经网络发挥作用的地方。在Mistry首次亮相的演讲中,他展示了从早期模型到现在(间隔四个月),惊人的改进速度。它还提供了对该技术实际工作方式的最佳见解。
在建立了一个工程师的面部模型,并生成了一个模仿他的头像之后,研究小组将其用于不同的人。然后,他们可以通过这个化身“交谈”,这听起来非常类似于deepfakes的工作方式。为了区分它们的不同,该团队随后建立了一个系统,可以自动生成面部表情和嘴部动作。它不是人的组合,而是一种全新的东西。
Neon的模型将能够从众多选项中生成面部动画(在新闻发布会上使用了“数百万”这个词)。如果有无数种微笑的方式,那么一个Neon头像显然有无数种遵循命令微笑的方式。我们从两个不同的方面看到了Neon的笑容。也许还有无数其他的微笑?我没有找到答案,但Neon在新闻稿中和对其他记者说的就是这种情况。在这些不同的表情中,他甚至可以抬起头像的眉毛。看到的这一切都是实时的,令人印象深刻的,但是这些都是基本层面。
那么,Neon还能做什么呢?在Mat的演示中,一个化身以中文,韩语和北印度语的形式流利地说了几句话,所有这些都是为了响应Neon员工的语音指令。但是“人工制造人”是相对静态的,除了响应处理程序的请求才会出现一些表情,Neon基本上是沉寂的,有种恐怖的感觉。嘴部的追踪尤其粗糙,当虚拟人物说话时,锯齿状的牙齿在波动着。
但是,对于CES参加者来说,最大的失望可能是互动程度太低,除了观众在Neon的发布活动中看到的重复性答案外,观众只能问几个简单的问题。当虚拟人物理解了这个问题时,它就会回答,这是我们仅可以得到的半点体面的回应。
Spectra:真正值得期待的新技术
然后是Spectra:这个平台代表了这里真正的新技术。这是令人兴奋的科幻部分,旨在处理这些“人工制造人”的学习和情绪反应。Spectra将从智力、学习、情感和记忆等方面,与CORE R3平台互补,给NEON赋能。不出所料,这是最难理解和得到直接答案的部分,也是这次发布中几乎缺失的部分。(这将成为公司今年的重点。)
尽管如此,该公司还是迅速定义了这些“人工制造人”可以做什么和不能做什么,并急于将这家小公司的雄心与现有科技巨头的类似努力区分开来。这些“人工制造人”显然不是聪明的助手,他们不会随意说出事实,也不会奉命唱小调。如果公司的Spectra平台得以实现,他们将能够从经验中学习,并与人类交流和产生共鸣。
Mistry向Mat提到,他想像一个老人一样,“不想把事实公布于众,他们想要进行一次谈话”。Neon想要避免那些令人印象深刻的、alexa式虚拟助手展示。
Mistry里很想知道人们对Neon的看法,以及在早期阶段的其他可能性。这个团队在发布会上吸引到的人们的目光可能会让STAR Lab的支持者三星非常高兴,但Neon的角色需要目标。该公司认为,其创意有一天可能会被用作银行助理、演员或酒店门房,而新闻发布会当时挤满了来自银行、度假村和零售商的代表,挤在一排持怀疑态度的记者中间。
最后,我想到了雄心勃勃和天真这两个词。如果Neon不断迭代、修复和完善,你就能看到它的走向。但就目前的水平来看,是我们兴奋过度了。Neon的展位与三星在CES上的展示区相距不远,尽管这家初创公司与展会的联系不是特别紧密,但仅凭这种联系就足以引起炒作。Neon本可以一直保持低调,直到他们有了更好的方法向人们解释,或者有了更好的演示来反映最初的说辞。
其实Neon并没有做错什么。它不过只是有一个过于热情的新闻发布会,但预告片并不能代表实际的结果,还有一个非常兴奋的CEO,他相信他的团队正在开发的技术。
Mistry称,“NEON就像是一个全新的物种”,“地球上现存有几百万种生物,我们希望NEON可以成为其中新的一员”。
让我们看看Neon在CES 2021上会有什么表现。
本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/469/146.htm]