8192块MI325X,北美最大AMD GPU训练集群,助您实现超强计算能力

更新时间:2025-07-14 20:43:16作者:hnzkhbsb
8192块MI325X,北美最大AMD GPU训练集群,助您实现超强计算能力

TensorWave成功创建基于Instinct MI325X显卡加速器的北美最大AMD GPU训练集群。

TensorWave宣布成功创建了基于Instinct MI325X显卡加速器的北美最大AMD GPU训练集群。这一集群配备了共计8192块MI325X,同时也是首个基于该GPU的DLC液冷计算集群。

AMD Instinct MI325X于2024年10月推出,采用了AMD CDNA 3 GPU架构,配备256GB下一代HBM3E高带宽内存。内置1530亿个晶体管。它提供了 6TB/s 的内存带宽,在 FP8 和 FP16 精度下分别达到2.6 PF和1.3 PF的峰值理论性能。

与英伟达上一代的旗舰GPU加速器H200相比,MI325X的内存容量更大(256Gvs141G),内存带宽也更高(6TB/s vs 4.8TB/s)。在算力方面,虽然英伟达官方宣称H200的FP16算力可达1.9 PF,但经semianalysis实测,其实际算力约为1PF,与H100持平,比MI325X低了30%。因此AMD MI325X在推理方面的表现平均超越H200 30%.

由MI325X核心集成的GPU平台包含8个MI325X。该平台总共提供2TB HBM3E高带宽内存,FP8 精度下的理论峰值性能达到20.8 PF,FP16 精度下达到10.4 PF。系统配备AMD Infinity Fabric 互连技术,带宽高达 896 GB/s,总内存带宽达到了 48 TB/s。相比于H200的集成平台H200 HGX,MI325X平台提供1.8倍的内存量,1.3倍的内存带宽和1.3倍的算力水平。在推理方面能相较H200 HGX提升至多1.4倍的表现水平。

TensorWave完成1亿美元A轮融资

今年5月,TensorWave 宣布完成1亿美元A轮融资。本轮融资由Magnetar和AMD Ventures联合领投,现有投资方Maverick Silicon和Nexus Venture Partners以及新投资方Prosperity7共同参与。这轮融资进一步巩固了TensorWave在早期安全股权融资轮次中的优势,使公司能够在下一代 AI 计算基础设施领域抓住快速增长的市场需求。

TensorWave成立于2019年,凭借其先进的技术和AMD的强大支持,迅速发展成为AI基础设施市场的新兴力量。TensorWave 专注于为企业提供高效的AI模型训练工具和基础设施,以优化AI工作负载。根据行业报告预测,到2027年,AI基础设施市场规模将突破4000亿美元,显示出该领域正经历前所未有的增长。

TensorWave创始人兼首席执行官Jason Zhang表示:“我们将利用这笔资金继续研发更高效的AI计算平台,满足客户在高性能计算方面的迫切需求。此外,我们也将加大在人才招聘和市场扩展上的投入,力争在全球范围内实现更快的增长。”

AMD高级副总裁兼首席技术官Mark Papermaster表示:“我们非常高兴能够支持TensorWave的技术创新。他们在AMD技术的基础上开发的高性能AI基础设施解决方案,将极大地推动人工智能产业的发展。”

TensorWave为何选择AMD芯片?

AI热潮让英伟达成为当仁不让的霸主,其GPU更是成为各种规模的AI公司首选的芯片。在这种情况下,TensorWave为何选择AMD芯片?

首先是价格。此前TensorWave的首席执行官兼联合创始人Darrick Horton指出,AMD MI300X的价格比当前最受欢迎的英伟达GPU H100便宜得多,这使得TensorWave能够将节省的成本传递给客户。虽然他没有透露TensorWave的具体实例定价,但如果想要打败H100,定价必须低于2.50美元/小时。

其次是性能。Horton引用了基准测试数据,显示MI300X 在运行(但不是训练)AI模型方面优于H100,尤其是在像Meta的Llama 2这样的文本生成模型上。

值得一提的是,之前Horton在接受采访时表示:“我们意识到这是一个不健康的垄断现象,这是一个导致最终用户无法获得计算资源并抑制AI领域创新的现象。出于AI大众化的愿望,我们决定提供一个可行的替代方案,恢复竞争和选择权。”

业内分析认为,当前对AMD芯片使用者的有利因素是英伟达GPU持续短缺,而不利的因素是如何跨越英伟达围绕AI芯片构建的竞争壁垒。英伟达的开发软件更为成熟且更易于使用,并且已被广泛部署。甚至AMD首席执行官苏姿丰也承认,采用AMD芯片“需要付出努力”。

*声明:本文系原作者创作。文章内容系其个人观点,我方转载仅为分享与讨论,不代表我方赞成或认同,如有异议,请联系后台。

想要获取半导体产业的前沿洞见、技术速递、趋势解析,关注我们!

相关教程

copyright ©  2012-2025 系统家园网 m.hnzkhbsb.com 版权声明