Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,460,675字

该文章投稿至Nemo社区   资讯  板块 复制链接


“造芯”,BAT 已全部下场

发布于 2021/07/18 14:21 399浏览 0回复 2,902

近日,腾讯招聘官网出现了多个与芯片有关的岗位,引发外界关注。

腾讯招聘披露的芯片研发岗位包括:芯片架构师、芯片验证工程师、芯片设计工程师等多个职位,工作地点可选择北京、上海、深圳等。

以芯片架构师为例,职责包括:负责 AI 芯片和通用处理器或者细分领域的需求分析,主导 AI,处理器芯片架构设计,竞争分析和规格定义;负责芯片领域的技术演进路标、关键技术,主导关键技术和架构的研究;负责大型芯片的架构设计,关键模块的把控和设计等。

而芯片设计工程师则要求精通数字电路设计流程,精通 RTL 代码书写,具有电路优化的经验;4 年以上数字前端设计经验,有大规模 SoC 芯片设计成功量产经历以及 CPU/NPU 等设计经验者优先等。

该招聘消息一经爆出,业界开始纷纷猜测:腾讯真的要进军“卡脖子”芯片领域?

对此疑问,7 月 16 日腾讯相关人士回应称,这是基于一些业务需要腾讯在特定领域有一些芯片研发的尝试,主要是 AI 加速和视频编解码等,但这并非外界所认为的通用芯片。

互联网大厂齐聚“造芯”赛道

实际上,腾讯几年前就已经开始了芯片领域的布局。

2016 年 11 月,腾讯就与阿里一起领投了可编程芯片公司 Barefoot Networks 的 2300 万美元 C 轮融资。

随后在 2018 年,AI 芯片公司 —— 上海燧原科技有限公司获得了腾讯领投的 Pre-A 轮 3.4 亿元人民币投资。

2019 年 6 月,腾讯跟投燧原科技的新一轮融资,在今年,腾讯又继续跟投了燧原科技的 C 轮融资。

2020 年 3 月 19 日深圳宝安湾腾讯云计算有限公司成立。该公司经营范围就包含了集成电路设计、研发等。

然而对于造芯这件事,腾讯并非是以 BAT 为代表的大型互联网公司中的唯一一家。

早在 2018 年 7 月,Baidu 发布云端全功能 AI 芯片“昆仑”,其中包含训练芯片昆仑 818-300,推理芯片昆仑 818-100。

目前,第一代昆仑芯片已于 2020 年初量产,目前已经规模化部署超过 2 万片,第二代昆仑芯片已经流片成功,将于 2021 年下半年量产。

而阿里巴巴在 2018 年 9 月的云栖大会上宣布成立平头哥半导体有限公司,主要任务是从事芯片的自研开发与战略布局。2019 年 9 月阿里巴巴第一颗自研芯片 ——AI 推理芯片含光 800 正式问世,阿里巴巴表示该芯片已经量产,服务于阿里巴巴内部。

“造芯”的初心,是为了打造一朵更高效的云

2020 Techo Park 开发者大会上腾讯云服务器与供应链管理部总经理刘裕勋就曾表示:

“随着云计算承载的业务规模越来越大,传统服务器难以完全满足云计算数据中心场景下对超大规模、需求多样、高性价比、安全可靠以及软硬件一体化等方面的要求。”

随着云计算产业的发展,从技术的角度说,云计算已经超过 IT 基础设施的范畴,正向上定义软件应用服务,向下定义芯片、服务器等 IT 硬件。

从技术角度来看,20 年前,虚拟化技术实现了硬件细节的抽象,让基础设施成为由软件管理的单一实体。过去 10 年,云计算进一步推动了这一进程,使硬件成为一种抽象资源,而且对于客户来说,这个资源越来越多地由别人来管理。

然而,云计算技术虽然使硬件变得抽象,但实际上,云服务商却在硬件层面在做这大量的创新工作,开始从最基础的芯片来构建云。

同样,在刘裕勋看来,随着云原生理念的不断推进,云基础架构的演进过程中会呈现出三个特点:高复杂度、高性价比、安全性

当海量业务承载在云基础架构设施的时候,业务的多样性,对于软硬件一体化的系统实际上提出了更高的要求。面临这样的复杂度,云厂商根据自身的情况,必然要开始自己进行研究相关芯片,或者是与其他芯片厂商联合起来进行深度定制,以此来解决各种复杂场景下的兼容性问题。

自研芯片的背后,则是对于 BAT 这般体量的云服务商而言,则是性价比最高的一条道路

而在技术上,以英特尔的 CPU 为例,CPU 的另外一个名字叫通用计算。而这也就代表着,搭载通用 CPU 的服务器具有很高的通用性,但是实际的应用中,势必会造成性能的浪费。

对于普通用户来说,可能十几上百台服务器就是应用的极限了,但是互联网大厂的服务器动辄就是上万甚至几十万台,因此每台性能的略微降低累积起来都是一个不得了的数字。

更重要的是,由于互联网应用的特殊性,相当一部分新采购的服务器都要进行针对性的优化,或者需要进行部分配件的调整与革新,也就需要投入大量的人力、精力和财力,造成资源的浪费。

因此对于以腾讯云为代表的云厂商来说,势必要从整机的设计上面,去精简不需要的功能;优化整机的散热能力,降低能耗。配备一个非常强的供应链的管控。去降低计算力的单位成本,并进而将这种成本红利释放给数百万的云上用户。

而在安全方面,从芯片层面就进行自研、定制化,势必能更好的保证整机系统的安全可靠。

就在近日上海闭幕的世界人工智能大会上,华为轮值董事长胡厚崑表示道:“只有基础打得牢,根技术扎得深,应用创新跑得快,才有人工智能产业的参天大树和生态的持续繁荣。”

其中技术要扎到根,根深才能叶茂。值得就是应该大力发展根技术,如处理器、AI 计算框架等,增强人工智能产业的发展韧性。

“硬件创新”已成云厂商必争之地

除国内云厂商之外,国外三家规模较大的云服务商亚马逊、微软和谷歌也硬件方面进行重金投入。用于提高自身云平台的性能或者调优服务来满足特定的用途,例如人工智能开发等等。

如谷歌把自己的云计算战略重点放在了处理人工智能工作负载上,为此设计了名为 TPU 的微处理器家族,号称相比 GPU 的成本更低性能更高。

对此,谷歌曾对外表示,2015 年的时候在多层神经网络 ResNet 50 上训练一个深度学习模型的成本超过 20 万美元,而今天,成本比一杯咖啡还便宜。

此外,微软 Project Olympus 是一项针对微软基于 OCP 构建的云平台打造一系列服务器结构块的项目。AWS 基于 ARM 的 Graviton 处理器从 2015 年开始开发,到现在已经在 AWS EC2 实例中实现普及。

“硬件专业化可以将延迟、性价比和功耗/性能比提高 10 倍,但多年来,大多数计算工作负载一直停留在通用处理器上,”AWS 工程师 James Hamilton 在一篇博客文章中这样写道。亚马逊每年要安装一百多万个专用芯片,专门用于机器学习工作负载。

亚马逊的 Nitro 项目则是将硬件和软件结合,消除虚拟化的开销。

阿里云的神龙架构则也是通过芯片层面的,通过软硬件结合的方式,来降低虚拟化损耗,华为云的擎天、京东的京刚则也是通过同样的方式。

对此,刘裕勋表示,云上的客户是非常的“挑剔”的,同时云计算市场的竞争也很激烈,客户都希望用低成本,高质量的产品,客户要求的苛刻会推动我们去做更多的变革和演进。

在此背景下,对于云服务商而言,通过自研服务器、自研数据中心技术、再到上层的 IaaS、PaaS、SaaS 平台的协同打造,势必是一条必须要走的道路。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/563/567.htm]

本文标签
 {{tag}}
点了个评