Echo

Echo 关注TA

大家好,我是Echo!

Echo

Echo

关注TA

大家好,我是Echo!

  •  普罗旺斯
  • 自由职业
  • 写了309,679,512字

该文章投稿至Nemo社区   资讯  板块 复制链接


AMD 最强 AI 加速卡 MI325X 登场:256GB HBM3E、6 TB/s 带宽,FP8 性能 2.6 PFLOPs,完善 ROCm 生态

发布于 2024/10/11 06:36 95浏览 0回复 940

IT之家 10 月 11 日消息,科技媒体 techpowerup 今天(10 月 11 日)发布博文,报道称在“Advancing AI”大会上,AMD 公司更新推出了 Instinct MI325X 加速卡。

MI325X 加速卡基于 CDNA 3 架构,相比较旧款 MI300X 带来了一系列改进。为了迎接万亿参数的 AI 模型,AMD MI325X 加速卡重点提升了 HBM3E 内存和计算能力。

规格和性能

AMD MI325X 加速卡配备 256 GB 的 HBM3E 内存,容量是 MI300(192GB)的 1.8 倍,带宽更是达到了 6 TB/s。

新的加速器在 FP16 下提供 1.3 PetaFLOPS,在 FP8 训练和推理下提供 2.6 PetaFLOPS,较 MI300 提升 1.3 倍,所有这些都集成在一个拥有 1530 亿个晶体管的芯片中。

配备八个 MI325X 加速器的系统可实现 20 TB HBM3E 内存和 48 TB/s 带宽,计算性能为 10.4 PetaFLOPS(FP16)和 20.8 PetaFLOPS(FP8)。

AMD 声称,Instinct MI325X 在内存带宽、FP16 / FP8 计算性能上超越 NVIDIA H200 HGX 系统 1.3 倍,在内存容量上超越 1.8 倍。

ROCm

加速器核心是 ROCm 软件堆栈,AMD 计划将 ROCm 引入每款 GPU(甚至包括消费级 GPU),并与开源社区合作集成最新功能。

AMD 表示会和开源社区合作,将 PyTorch、Triton、ONNX 等框架的功能整合到  ROCm 堆栈中。

Instinct MI350X 系列

IT之家援引 AMD 官方报道,该公司正在为 2025 年下半年准备 Instinct MI350X 系列,预计将推出基于 TSMC 3 纳米工艺的 CDNA 4 Instinct MI355X 加速器,配备 288 GB HBM3E。

广告声明:文内含有的对外跳转链接(包括不限于超链接、二维码、口令等形式),用于传递更多信息,节省甄选时间,结果仅供参考,IT之家所有文章均包含本声明。


本文由LinkNemo爬虫[Echo]采集自[https://www.ithome.com/0/801/261.htm]

本文标签
 {{tag}}
点了个评