AMD发布MI350X和MI355X两款GPU,性能卓越并公布未来产品路线图

🤖 由 文心大模型 生成的文章摘要

AMD在美国圣何塞举办的Advancing AI 2025大会上,正式发布了全新一代“Instinct MI350系列”GPU,包括MI350X和MI355X两款型号。这两款GPU在性能和技术特性上取得了重大突破,为AI计算领域带来了新的活力。​

MI350系列基于第四代Instinct架构(CDNA4),采用3nm制程工艺,集成了高达1850亿个晶体管。两款GPU均配备288GB的HBM3E内存,内存带宽达8TB每秒,内存容量是英伟达B200和GB200GPU的1.6倍。在算力方面,MI350X和MI355X在FP64精度下的算力分别为72和78.6TFLOPs,约为英伟达同类产品的两倍。在低精度格式(如FP16、FP8和FP4)上,MI350系列的性能与英伟达相当或更优。其中,MI355X在FP4精度下,相比英伟达B200,大模型推理速度快30%,在训练推理性能方面也相当或更胜一筹。同时,得益于芯片功耗低于英伟达,在MI355X上每花费1美元,可以比B200多跑40%的tokens。​

在核心设计相同的基础上,MI350X和MI355X针对不同散热方式设计。MI350X采用风冷,最高TBP为1000W;MI355X采用液冷,TBP达到1400W,更高的TBP使得MI355X性能高于同架构的MI350X。​

为了更好地配合MI350系列,AMD发布了全新的ROCm7软件栈。相比ROCm6,ROCm7实现了3.5倍的推理性能提升和3倍的训练性能提升,还引入了分布式推理支持,并与VLM和SGLang等开源推理框架深度集成,支持超过180万个Hugging Face模型开箱即用。​

AMD在发布会上还公布了未来产品路线图。下一代GPU——MI400系列将于明年亮相,该系列由AMD和OpenAI联合研发,OpenAI为其训练和推理需求提供了重要反馈。MI400系列将采用下一代CDNA架构,预计速度比MI300系列快10倍,FP4运行速度将达到40PFLOPs。此外,AMD计划在2027年推出MI500系列GPU,同时还将推出代号为Verano的下一代EPYC处理器,进一步丰富其产品布局,提升在AI计算市场的竞争力。​

「93913原创内容,转载请注明出处」