Dojo ExaPOD Tesla суперкомпьютер NVIDIA GPU
Ожидается, что новый суперкомпьютер расширит возможности Tesla по обучению нейронных сетей.
Компания Tesla представила последнюю версию своего суперкомпьютера Dojo, который оказался настолько мощным, что смог отключить энергосистему в Пало-Альто.
Платформа Dojo была разработана с нуля для машинного обучения с особым упором на видеообучение с использованием видеоданных, поступающих от электромобилей Tesla.
У автопроизводителя уже есть большой суперкомпьютер на базе NVIDIA GPU, который является одним из самых мощных в мире, однако в новом компьютере Dojo используются чипы и совершенно новая инфраструктура, разработанная Tesla.
Ожидается, что новый суперкомпьютер расширит возможности Tesla по обучению нейронных сетей на основе видеоданных, что имеет решающее значение для технологии компьютерного зрения, обеспечивающей беспилотное вождение.
Год назад компания впервые сообщила о создании Dojo. Теперь же она рассказала о достигнутом прогрессе за год.
Модернизация прошлогодней программы Dojo включает в себя переход от системы чипов и плиток к лотку и полному шкафу. Как сообщают в компании, ей удалось заменить шесть блоков GPU одной плиткой Dojo, которая стоит меньше, чем один блок графических процессоров. В одном лотке имеется шесть таких плиток.
Один лоток обеспечивает производительность, эквивалентную трем-четырем полностью загруженным стойкам для суперкомпьютеров. Кроме того, Tesla также интегрирует свой хост-интерфейс непосредственно в системный трей, чтобы сформировать полноценную сборку хоста. Компания может разместить два таких системных лотка с узлами в одном корпусе Dojo.
Компания все еще разрабатывает и тестирует инфраструктуру, необходимую для установки нескольких шкафов вместе для создания первого Dojo ExaPOD, основные характеристики которого уже известны: 1,1 EFLOP, 1,3 ТБ SRAM и 13 ТБ DRAM с высокой пропускной способностью.
Билл Чанг, главный системный инженер компании Tesla по проекту Dojo, сказал в своем заявлении: «Мы знали, что нам нужно пересмотреть каждый аспект инфраструктуры центра обработки данных, чтобы обеспечить беспрецедентное охлаждение и плотность мощности». Компании пришлось разработать собственную мощную систему охлаждения и питания шкафов Dojo.
Чанг подтвердил, что Tesla отключила подстанцию своей местной электросети при тестировании Dojo: «Ранее в этом году мы начали нагрузочное тестирование нашей инфраструктуры электропитания и охлаждения, и нам удалось поднять мощность выше 2 МВт, прежде чем мы отключили нашу подстанцию и получили звонок из города».
Tesla собирается развернуть свой первый кластер к первому кварталу 2023 года и планирует иметь семь Dojo ExaPOD в Пало-Альто.
SECURITYLAB.RU