Генеральный директор AMD Лиза Су (Lisa Su) выступила на мероприятии Advancing AI, где рассказала о новой серии ускорителей высокопроизводительных вычислений Instinct MI350, акцентировав внимание на старшей модели в лице MI355X, хотя отличие от MI350X заключается лишь в повышенном теплопакете.
Новый серверный флагман AMD полагается на 3-нм технологический процесс TSMC и графическую архитектуру CDNA 4, вмещая в себя 185 млрд транзисторов. Внутри графического процессора присутствует 256 вычислительных блоков, каждый из которых насчитывает по 64 потоковых процессора, что в сумме даёт 16384 ядра, в то время как у представителей прошлой серии можно было наблюдать до 19456 ядер.
Значительно прокачанный процессор подкреплён 288 Гбайтами видеопамяти HBM3E, набранной восемью 12-слойными стеками по 36 Гбайт каждый, причём они оснащены новым стандартом UBB8 для более быстрого развёртывания инфраструктуры искусственного интеллекта. Их совокупная пропускная способность достигает 8 Тбайт/с. Потребляет всё это добро 1000 Вт в случае MI350X и 1400 Вт в случае MI355X.
По заявлению AMD, возможностей старшего ускорителя достаточно для демонстрации 79 TFLOPS FP64, 5 PFLOPS FP16, 10 PFLOPS FP8 и 20 PFLOPS FP6/4, а сравнение флопсов происходило с NVIDIA B200 и GB200, против которых красная новинка оказывается до 2,2 раз производительнее в зависимости от вида операций, но лишь на бумаге. На деле разница куда меньше и в самом лучшем случае достигает 30%. Также компания хвастается возможностью генерировать на 40% больше токенов на доллар по сравнению с B200 конкурента.
По сравнению с моделью прошлого поколения MI300X, новый флагман не только до 4,2 раза быстрее, но и в 35 раз более энергоэффективен.
Одна серверная стойка может вмещать до 8 ускорителей Instinct MI350X и MI355X, предлагая до 2,3 Тбайта видеопамяти, до 64 Тбайт/с пропускной способности видеопамяти, 0,63 PFLOPS FP64, 81 PFLOPS FP8 и 161 PFLOPS FP6/FP4, но и потреблять такое решение будет приличное количество энергии. Полноценный сервер может вмещать до 128 ускорителей, 36 Тбайт памяти, 2,6 EFLOPS FP4 и 1,3 EFLOPS FP8. Для его охлаждения предусмотрена СЖО, тут воздух не поможет.
Серия ускорителей AMD Instinct MI350 запускается сегодня, а в продаже её представителей можно будет заметить в следующем квартале через партнёров.