Tesla представила свой суперчип D1 для машинного обучения
25.08.21
Tesla представила свой новый специализированный процессор D1 для машинного обучения. Процессор производится по нормам 7 нм и содержит 50 млрд транзисторов. Площадь при этом составляет 645 мм2, что весьма много, хотя и меньше, чем у NVIDIA GA100.

Tesla D1 оснащён 354 обучающими узлами на базе 64-разрядного суперскалярного процессора с четырьмя ядрами. Решение поддерживает инструкции FP32, BFP16, CFP8, INT32, INT16 и INT8.
Производительность в вычислениях с одинарной точностью (FP32) составляет 22,6 TFLOPS, а в случае режима BF16/CFP8 речь идёт о 362 TFLOPS. Такие результаты достигаются при TDP 400 Вт.
Так как для машинного обучения важна масштабируемость, Tesla разработала специализированный интерфейс с пропускной способностью 10 ТБ/с. Кольцо ввода-вывода включает 576 полос, каждая из которых имеет пропускную способность в 112 ГБит/с.

В итоге Tesla может собирать чипы D1 в специальные плитки по 25 процессоров в каждой. И такие плитки также можно соединять между собой. Компания продемонстрировала такую плитку с процессорами, работающими на частоте 2 ГГц. Производительность такого решения составила 9 PFLOPS (BF16/CFP8).
У компании есть планы по созданию суперкомпьютера на основе процессоров D1. Система ExaPOD будет основана на 120 плитках с 3000 процессоров. Итоговая производительность достигнет 1,1 ExaFLOPS (FP16/CFP8).

После постройки система будет самым мощным суперкомпьютером для обучения ИИ. В сравнении с нынешними суперкомпьютерами Tesla на основе GPU NVIDIA такая система предложит в 4 раза большую производительность и в 1,3 раза большую производительность на ватт при пятикратном снижении занимаемой площади.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Топ новостей 2025 года сайта hi-tech.ua
Традиционно каждый год наша редакция подводит итоги. Лучшие устройства по версии редакции мы показали недавно. Теперь пришло время рассказать о топе новостей сайта hi-tech.ua в 2025 году.
Четверть YouTube Shorts сгенерированы искусственным интеллектом YouTube искусственный интеллект
Для исследования компания создала новый аккаунт на YouTube и проанализировала первые 500 видео, которые алгоритм показал в ленте Shorts
Nvidia приобрела акции Intel на $5 миллиардов Intel NVIDIA бизнес
Соглашение между Nvidia и Intel было достигнуто осенью этого года. В его рамках компания под руководством Дженсена Хуанга приобрела 214,7 млн акций Intel на общую сумму около 5 млрд долларов


