Echo

关注TA

大家好，我是Echo！

该文章投稿至Nemo社区资讯板块复制链接

AMD 最强 AI 加速卡 MI325X 登场：256GB HBM3E、6 TB/s 带宽，FP8 性能 2.6 PFLOPs，完善 ROCm 生态

发布于 2024/10/11 06:36 95浏览 0回复 940字

IT之家 10 月 11 日消息，科技媒体 techpowerup 今天（10 月 11 日）发布博文，报道称在“Advancing AI”大会上，AMD 公司更新推出了 Instinct MI325X 加速卡。

AMD 最强 AI 加速卡 MI325X 登场：256GB HBM3E、6 TB/s 带宽，FP8 性能 2.6 PFLOPs，完善 ROCm 生态

MI325X 加速卡基于 CDNA 3 架构，相比较旧款 MI300X 带来了一系列改进。为了迎接万亿参数的 AI 模型，AMD MI325X 加速卡重点提升了 HBM3E 内存和计算能力。

AMD 最强 AI 加速卡 MI325X 登场：256GB HBM3E、6 TB/s 带宽，FP8 性能 2.6 PFLOPs，完善 ROCm 生态

AMD MI325X 加速卡配备 256 GB 的 HBM3E 内存，容量是 MI300（192GB）的 1.8 倍，带宽更是达到了 6 TB/s。

AMD 最强 AI 加速卡 MI325X 登场：256GB HBM3E、6 TB/s 带宽，FP8 性能 2.6 PFLOPs，完善 ROCm 生态

新的加速器在 FP16 下提供 1.3 PetaFLOPS，在 FP8 训练和推理下提供 2.6 PetaFLOPS，较 MI300 提升 1.3 倍，所有这些都集成在一个拥有 1530 亿个晶体管的芯片中。

AMD 最强 AI 加速卡 MI325X 登场：256GB HBM3E、6 TB/s 带宽，FP8 性能 2.6 PFLOPs，完善 ROCm 生态

配备八个 MI325X 加速器的系统可实现 20 TB HBM3E 内存和 48 TB/s 带宽，计算性能为 10.4 PetaFLOPS（FP16）和 20.8 PetaFLOPS（FP8）。

AMD 最强 AI 加速卡 MI325X 登场：256GB HBM3E、6 TB/s 带宽，FP8 性能 2.6 PFLOPs，完善 ROCm 生态

AMD 声称，Instinct MI325X 在内存带宽、FP16 / FP8 计算性能上超越 NVIDIA H200 HGX 系统 1.3 倍，在内存容量上超越 1.8 倍。

加速器核心是 ROCm 软件堆栈，AMD 计划将 ROCm 引入每款 GPU（甚至包括消费级 GPU），并与开源社区合作集成最新功能。

AMD 表示会和开源社区合作，将 PyTorch、Triton、ONNX 等框架的功能整合到 ROCm 堆栈中。

IT之家援引 AMD 官方报道，该公司正在为 2025 年下半年准备 Instinct MI350X 系列，预计将推出基于 TSMC 3 纳米工艺的 CDNA 4 Instinct MI355X 加速器，配备 288 GB HBM3E。

广告声明：文内含有的对外跳转链接（包括不限于超链接、二维码、口令等形式），用于传递更多信息，节省甄选时间，结果仅供参考，IT之家所有文章均包含本声明。

点了个评