Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,918,638字

该文章投稿至Nemo社区   资讯  板块 复制链接


AI 训练性能提高 2.5 倍,三星使用 96 张改造的 AMD Instinct MI100 GPU 打造大型计算系统

发布于 2022/12/15 14:25 219浏览 0回复 869

IT之家 12 月 15 日消息,三星使用内置 PIM(processing-in-memory)的显卡,打造出了全球首个大型计算系统。援引 Business Korea 报道,通过使用 96 张经过 PIM 改造的 AMD Instinct MI100 GPU,将 AI 训练性能提高了 2.5 倍。

PIM 是新型计算机内存,可以加速 CPU 和 GPU 等处理器的处理能力。PIM 最大的特点是每个内存模块都能够自行处理数据,从而减少在内存和处理器之间传输所需的数据量。

三星曾在今年 10 月公开展示过经过 PIM 改造的 GPU,而现在该公司将 96 张经过 PIM 改造的 GPU 放在集群中。与普通显存相比,这些经过改进的 MI100 芯片不仅性能提高了 2.5 倍,而且功耗降低了 2.67 倍,大大提高了 GPU 在运行 AI 算法时的效率。

三星开发 PIM 已有一段时间了。该公司在 2021 年演示了多种实现,涉及多种不同的内存类型,包括 DDR4、LPDDR5X、GDDR6 和 HBM2。在 LPDDR5 形式中,三星在涉及 Meta AI 工作负载的测试程序中看到性能提高了 1.8 倍,功耗降低了 42.6%,延迟降低了 70%。

IT之家了解到,AMD Instinct MI100 加速器经过全新设计,全面迎接计算新时代。1 MI100 加速器采用 AMD CDNA 架构,在计算和互连性能方面实现了巨大的飞跃,与上一代 AMD 加速器相比,高性能计算(FP32 矩阵)性能提升近 3.5 倍,而人工智能 (FP16) 性能则提升近 7 倍。

三星并不是唯一一家开发 PIM 芯片的公司 ——SK 海力士今年早些时候发布了自己的 PIM 模块。根据 SK 海力士的初步测试,其 GDDR6-AiM(内存加速器)应用程序可将 AI 处理速度提高 16 倍,并将功耗降低 80%。这比三星修改后的 MI100s 快很多,但我们不知道 SK hynix 使用什么工具进行测试,因此不能直接比较。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/661/307.htm]

本文标签
 {{tag}}
点了个评