
AMD致力于AI领域的最新动态,围绕着采用HBM4内存实现性能提升的下一代AI数据中心GPU“Instinct MI400”系列、强大的AI硬件驱动软件“ROCm”,以及通过行业标准和开源构建开放生态系统。本文结合2024年4月22日在新加坡举办的研讨会内容,深入探讨AMD的AI战略。
研讨会开场由AMD高级总监、产品开发工程及新加坡区负责人El Saravanan致辞。AMD新加坡自1984年作为大规模生产基地成立,近15年来逐步转型,现已成为涵盖产品开发到市场投放的工程研发中心,快速引入包括最新GPU在内的创新技术,成为关键影响力据点。

新加坡政府大力支持半导体产业,注重人才培养与研发,推动产业、学术及政府间的卓越生态系统建设,使其成为半导体供应链的重要区域。借助这一背景及AMD强大的生态系统,AMD能够在AI等创新速度极为关键的领域,满足客户对速度、质量、可靠性和一致性的需求,提供创新产品。
下一代Instinct MI400配备432GB大容量HBM4内存

AMD高级专家兼Instinct SoC首席架构师Alan Smith介绍了计划于2026年推出的下一代数据中心GPU“Instinct MI400”系列。该系列包括面向AI的旗舰型号“MI455X”和面向高性能计算及主权AI的“MI430X”,本次重点介绍了MI455X。
MI455X将内存从HBM3E升级至HBM4,容量达到432GB,带宽高达19.6TB/s。计算性能显著提升,FP4精度下达到40PFLOPS,FP8精度达到20PFLOPS。此外,扩展和横向带宽均有所提升,支持名为“Helios”的机架服务器。

Helios服务器由AMD EPYC CPU、Instinct MI400系列GPU和Pensando NIC组成,每个机架可搭载72块GPU。其设计基于开放硬件规范OCP Design和网络标准UEC(超以太网联盟),与竞争对手NVIDIA的Vera Rubin相比,内存容量和横向带宽提升了1.5倍,展现出明显优势。

同时,现有的Instinct MI350系列也被介绍。该系列采用台积电3nm(N3P)工艺制造的计算芯片(1850亿晶体管)和6nm FinFET(N6)工艺的I/O基板,配备最大288GB的HBM3E内存,采用3D多芯片封装技术CoWoS-S,最大板载功耗提升至1400W。
在计算格式方面,新增支持AI低精度矩阵格式MXFP6/MXFP4,继续支持Matrix FP16/BF16等低精度格式,性能提升最高达1.9倍。通过Infinity Fabric技术,最多可连接8块Instinct MI350 GPU实现多节点配置,速度提升至38.4Gbps,比上一代快20%。

ROCm软件支持多样AI模型,助力开发者

AMD企业副总裁、AI软件生态负责人Ramine Roane介绍了面向AI和高性能计算的软件栈。除了强大的硬件,AMD还提供ROCm软件平台。ROCm战略包括:ROCm栈及HIP(类似NVIDIA CUDA)的开源化,简化且加速开发的抽象层,以及通过AI Assist实现的代码自动化。

ROCm支持多种前沿AI模型,且从Day 0起支持Hugging Face上超过220万个模型,原生支持PyTorch、vLLM等主流开源项目。最新ROCm 7版本在推理和训练方面均有增强,推理支持vLLM v1引擎优化、分布式推理及Instinct MI355X的FP4原生支持;训练方面提升了MoE训练效率、强化学习速度,并支持Primus训练框架。

ROCm不仅支持数据中心产品,也支持搭载Ryzen AI的客户端及工作站PC,方便开发者从本地原型开发无缝扩展到数据中心生产环境。
AMD还积极支持开发者,发布涵盖环境搭建、AI模型运行及应用开发的“Playbook”指南,举办全球黑客松,并通过“AMD AI Developer Program”提供工具、知识和社区支持。

此外,针对基础设施管理员和开发者,AMD提供了简化AI应用部署的微服务“AMD Inference Microservices(AIMs)”及软件套件“AMD Enterprise AI Suite”。

OpenClaw与本地LLM结合的演示及开发者沙盒

AMD首席AI软件开发工程师Seungrok Jung主持了面向开发者的沙盒环节,介绍了ROCm软件栈中针对大型语言模型(LLM)的优化技术,如加速推理的“AITER(AI Tensor Engine for ROCm)”和解决多节点扩展瓶颈的“MoRI(Modular RDMA Interface)”。

参与者还通过连接Instinct MI355X实例,动手构建多AI代理系统,实现了从条形码识别食品到查询营养成分的AI代理功能。
同时,展示了结合OpenClaw与本地LLM(Qwen)的演示。AMD开发者计划已支持OpenClaw。

此外,合作伙伴如TensorWave联合创始人Piotr Tomasik和MangoBoost CEO Jangwoo Kim也分享了AMD产品的应用案例。



