Китайский ИИ DeepSeek ускоряет Nvidia H800 в 8 раз с помощью FlashMLA для обхода санкций
28.02.25
По данным разработчиков, использование FlashMLA увеличивает вычисКитайская компания DeepSeek представила технологию FlashMLA, которая позволяет существенно повысить производительность чипов Nvidia Hopper H800.лительную мощность H800 до 580 TFLOPS при умножении матриц в формате BF16 — это восемь раз выше стандартных показателей.
Что такое FlashMLA?
FlashMLA — это программная оптимизация, улучшающая работу процессоров Nvidia Hopper без аппаратных изменений. Она увеличивает пропускную способность памяти H800 до 3000 ГБ/с, что почти вдвое превышает стандартный максимум.
- Low-rank key-value compression — алгоритм, разбивающий фрагменты данных на меньшие части для ускоренной обработки.
- Оптимизированное использование памяти — сокращает ее потребление на 40–60%.
- Динамическое распределение ресурсов — система подкачки памяти регулирует загрузку в зависимости от задачи, что ускоряет обработку последовательностей переменной длины.
Обход американских санкций?
DeepSeek FlashMLA демонстрирует потенциал программных оптимизаций для китайской ИИ-индустрии. Фактически, она позволяет использовать H800 с эффективностью, близкой к более мощному H100, поставки которого в Китай ограничены санкциями.
Пока FlashMLA работает только с H800, но возможное расширение на другие модели может значительно повлиять на рынок ИИ-вычислений.
Кроме DeepSeek, китайские исследователи продолжают разрабатывать методы увеличения мощности доступных графических процессоров. Недавно ученые из Шэньчжэньского университета и Пекинского технологического института увеличили производительность Nvidia RTX 4070 в задачах перидинамики в 800 раз. Однако этот проект имеет военно-промышленные последствия, так как был разработан в сотрудничестве с российскими специалистами.
Не пропустите интересное!
Підписывайтесь на наши каналы и читайте анонсы хай-тек новостей, тестов и обзоров в удобном формате!
Обзор смартфона Oppo A6 Pro: амбициозный
Новый смартфон Oppo A6 Pro — телефон среднего уровня с функциональностью смартфонов премиум-класса. Производитель наделил его множеством характеристик, присущих более дорогим телефонам. Но не обошлось и без компромиссов. Как именно сбалансирован Oppo A6 Pro – расскажем в обзоре.
Источники автономного питания для дома: инверторы, аккумуляторы, солнечные панели
Попробуем разобраться, как правильно выбрать инвертор в зависимости от мощности нагрузки, типа синусоиды и конфигурации аккумуляторной системы.
Vivo X200T получил Mediatek Dimensity 9400+, яркий AMOLED экран и аккумулятор 6200 мА·ч Vivo смартфон
Смартфон Vivo X200T оснащён тройной камерой, созданной совместно с Zeiss: основной модуль Sony LYT-702 на 50 Мпикс, сверхширокоугольный сенсор Samsung JN1 и телеобъектив с сенсором Sony LYT-600
Leica Camera могут купить за €1 миллиард Leica бизнес
Leica имеет более чем 150-летнюю историю и известна своими премиальными камерами, объективами и оптикой. Основателем компании был Эрнст Ляйтц


