Вопросы специализации микропроцессоров резко обострились в последнее время в связи с развитием потребностей дата-центров (ЦОД) искусственного интеллекта (ИИ). В мире в 2023 г. эти ЦОД потребили 2% выработанной электроэнергии, а к 2030 г. ожидается потребление на уровне 7%. В США энергопотребление ЦОД растет до 20% ежегодно, а к 2030 г. достигнет 100–150 ГВт, что эквивалентно потреблению 2/3 домохозяйств. Такие затраты в значительной мере приходятся на обучение больших языковых моделей (LLM) с триллионами параметров для ЦОД ИИ.
В настоящее время мировым лидером рынка чипов для ИИ является фирма NVIDIA (США), которая поставляет линейку графических процессоров (GPU) с мощностями до 1000 Вт. Перевод воздушного на водяное охлаждение серверов снижает энергопотребление на 40%, а на иммерсионное жидкостное охлаждение — на 50%. Наиболее важными проблемами в части повышения производительности и быстродействия чипов является параллельно-потоковая структура GPU, а также децентрализация ЦОД с учетом их специализации. В работах автора [1–3] анализируются возможности конкурирующих с GPU фотонных процессоров [4–6], посвящены реализации параллельно-потоковой структуре GPU [7, 8], описывают специфику серверов ЦОД и опыт Huawei (Китай) в части сети ИИ [9–11] освещают архитектуру GPU.
Цель статьи состоит в анализе динамики подходов в части развития микропроцессоров для традиционных компьютеров и серверов ЦОД ИИ.
Традиционная структура классических компьютеров сложилась из сочетания следующих типов микропроцессоров:
• центральный процессор СРU с последовательным вычислением общих задач;
• графический процессор GPU в виде микросхем для параллельного вычисления специальных задач;
• цифровой сигнальный процессор DSP для решения специфических задач с высокой регулярностью обращения;
• программируемая пользователем вентильная матрица FPGA (ППВМ) или программируемая логическая интегральная схема (ПЛИС) для ускорения специфических задач.
Именно в целях распараллеливания графических вычислений центральные процессоры (CPU) персональных компьютеров (ПК) стали суперскалярными, в результате чего получили возможность одновременного (векторного) исполнения некоторых операций сразу над несколькими числами в составе нескольких ядер. Однако самыми эффективными устройствами для распараллеливания вычислений на ПК стали специализированные графические процессоры (GPU). Эти процессоры, разработанные именно для обработки графики, практически полностью ориентированы на параллельную обработку данных.