288GB海量内存!AMD官宣下代GPU加速卡Instinct MI355X:3nm CNDA4全新架构
原标题:288GB海量内存!AMD官宣下代GPU加速卡Instinct MI355X:3nm CNDA4全新架构
导读:
六月份的大会才过去没多久纯血鸿蒙那智能流畅和安全属性给大伙的震撼还未消去殊不知新一轮的华为新品发布会就又双叒续了上来具体为在即将月日美国旧金山现场报道除了正式发布升级版的还宣布...
六月份的HDC大会才过去没多久。 纯血鸿蒙那智能、流畅和安全属性,给大伙的震撼还未消去。 殊不知,新一轮的华为新品发布会,就又双叒续了上来。 具体为。 在即将....
10月11日美国旧金山现场报道:
除了正式发布升级版的 MI325X ,还宣布了全新的下一代 的首款产品Instinct ”,并披露了部分规格、性能数据。
MI355X将在2025年下半年上市,也就是还有差不多一年时间。
MI350系列将首次升级为台积电3nm工艺,首次采用 ,首次引入FP6、FP4浮点数据类型,搭配内存还是HBM3E但是容量高达288GB。
具体功耗没有披露,但是MI325X已经最高达1000W,AMD也透露MI355X会顺应行业趋势(NVIDIA B200 1000W、GB200 1700W),因此必然会显著超过1000W。
FP6、FP4都属于浮点数据格式,分别代表6位、4位精度,也就是只需6位、4位就能表达一个数字,相比于FP16、F8精度大大降低,但是数据处理量也大大减少,适合大模型的量化,特别是大语言模型和混合专家模型。
如果你不需要太高的精度,更想要速度,FP6、FP4就 适合。
MI355X上的FP6、FP4浮点性能都是9.2 PFlops(每秒9200万亿次运算),同时还将FP16、FP8性能都提升了80%,分别达到2.3 PFlops、4.6 PFlops。
NVIDIA Blackwell GPU同样引入了FP6、FP4精度,但是性能更高,分别达20 PFlops、40 PFlops。
单卡多达288GB HBM3E内存确实是无可匹敌,同时带宽高达8TB/s。
对比MI325X分别多出1/8、1/3,而相比目前已上市的MI300X都增 足足50%。
对比竞品,Blackwell B200也只有192GB HBM3E,但带宽同样做到了8TB/s。
MI355X同样支持单 八卡,这样就有总计2.3TB HBME内存、64TB/s带宽,性能更是高达FP16 18.5 PFlops、FP8 37 PFlops、FP6/FP4 74 PFlops。
它也将在明年下半年供货。
Instinct系列的性能进步幅度无疑是飞跃性的,一代一个新模样,跨代对比更是惊人。
MI355X对比MI300X,FP16性能达到了7.4倍之多,HBM容量也有1.5倍,所能处理的模型参数规模,也从7140亿增加到4.2万亿,足足6倍之多。
2026年将推出再下一代的Instinct MI400系列,基于再下一代的CDNA架构(CDNA 5?),规格和性能必将再次迈上一个大大的台阶。