AMD представляет свой графический процессор MI100, который считается самым мощным чипом для суперкомпьютеров

На фото: AMD MI100

В понедельник AMD анонсировала свой ускоритель Instinct MI100, графический процессор, предназначенный для ускорения работы программного обеспечения AI и математических задач для суперкомпьютеров и высокопроизводительных серверов.

Это 7-нанометровый графический процессор с кодовым названием Arcturus, изготовленный TSMC, и он первый, в котором реализована архитектура AMD CDNA. Сообщается, что оборудование включает 120 вычислительных единиц и 7680 потоковых процессоров, способных выполнять до 11,5 терафлопс с точностью FMA64 и FP64. Пик кремния составляет 184,6 терафлопс для матричных операций FP16 и 92,3 терафлопс для модной математики bfloat16, хвасталась AMD. Он поставляется на карте PCIe.

«Сегодня AMD делает большой шаг вперед на пути к эксафлопным вычислениям, представляя AMD Instinct MI100 – самый быстрый в мире графический процессор для высокопроизводительных вычислений», – заявил Брэд Маккреди, корпоративный ветеран AMD в области графических процессоров для центров обработки данных и ускоренной обработки. «Наш новейший ускоритель в сочетании с открытой программной платформой AMD ROCm, ориентированный на решение рабочих нагрузок, имеющих значение в научных вычислениях, призван предоставить ученым и исследователям превосходную основу для их работы в области высокопроизводительных вычислений».

На прошлой неделе AMD не раскрыла журналистам количество транзисторов или размер кристалла. Однако публичные спецификации показывают, что каждый чип использует интерфейс PCIe 4, содержит 32 ГБ памяти HBM2, может поддерживать пропускную способность памяти до 1,2 ТБ в секунду и имеет максимальный TDP 300 Вт. Они также могут передавать 340 ГБ в секунду полосы пропускания на карту с помощью трех каналов AMD Infinity Fabric.

Почитайте еще:   Новая видеокарта AMD Radeon RX 6800 XT составит конкуренцию Nvidia RTX 3080

Ускоритель MI100 разработан, чтобы конкурировать с новейшими графическими процессорами Nvidia A100. Однако у A100 больше оперативной памяти и пропускной способности памяти (до 80 ГБ и 2039 ГБ / с). И хотя MI100 имеет более высокую базовую производительность FP64 (11,5 TFLOPS против 9,7 TFLOPS для A100), при использовании тензорных ядер производительность FP64 A100 достигает 19,5 TFLOPS. A100 также имеет более высокую производительность при более низкой точности и имеет более высокий максимальный TDP.

AMD считает, что ее ускоритель MI100 предложит покупателям более дешевый путь к созданию суперкомпьютера exascale, однако, предлагая более высокую производительность за доллар по сравнению с A100. Аппаратное обеспечение поддерживается платформой с открытым исходным кодом AMD ROCm 4.0, которая может ускорить фреймворки машинного обучения PyTorch и Tensorflow.

Ожидается, что графические процессоры MI100, разработанные для использования вместе с серверными процессорами AMD Epyc, справятся с тяжелыми рабочими нагрузками машинного обучения и моделирования для таких вещей, как моделирование климата, астрофизика и гидродинамика. MI100 будет доступен у различных поставщиков, включая HPE, Dell, Supermicro и Gigabyte, и ожидается, что поставки начнутся в этом месяце.

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

vote
Рейтинг статьи

Если вы нашли ошибку, пожалуйста, выделите фрагмент текста и нажмите Ctrl+Enter.

Подписаться
Уведомление о
0 Комментарий
Посмотреть все комментарии
View all comments
Share on facebook
Share on twitter
Share on vk
Share on whatsapp
Share on telegram
Share on pinterest

Будьте первыми!

Подписывайтесь и читайте анонсы наших новостей во всех популярных каналах:

Сообщить об опечатке

Текст, который будет отправлен нашим редакторам: