
Искусственный интеллект и машинное обучение – центральные темы новостей и аналитических статей. О них говорят в контексте сервисов, пользовательских сценариев, эффективности бизнеса, цен на оперативную память и графические карты.
Кажется, что ИИ уже стал почти бытовой технологией, доступной всем и каждому. Но мало кто при этом задается вопросом: а на чем всё это работает?
В этой статье мы расскажем, как искусственный интеллект меняет требования к дата-центрам, и как они адаптируются к новым задачам и новой цифровой реальности.
От 5 до 20 кВт: почему стандартная инфраструктура ЦОД не справляется с ИИ-нагрузками?
Мощность серверов растет и без искусственного интеллекта. Если три года назад для питания одной серверной стойки требовалось порядка 5 кВт, то сейчас «обычному» клиенту нужно 10 кВт и более.
Но этот рост эволюционный и прогнозируемый, ЦОДы к нему готовы и заранее планируют свое развитие. С ИИ все по-другому: он развивается революционно и требует от ЦОД не просто регулярного масштабирования инфраструктуры, а ее серьезного пересмотра.
Давайте разбираться, почему.


Эффект ИИ и удельная энергонагрузка на разные типы стоек в ЦОД. Источник
Функционирование искусственного интеллекта принципиально отличается от привычных сценариев высоконагруженных вычислений. При решении классических задач нагрузка обычно предсказуема, распределена по времени и масштабируется линейно, а для ИИ нужна высокая локальная плотность вычислений, поскольку эти технологии очень чувствительны к задержкам внутри кластера.
Это означает, что мощность концентрируется не на уровне машинного зала или ряда, а на уровне одного шкафа, а то и отдельной GPU-конфигурации внутри стойки. В результате требования к питанию стойки вырастают в разы, до 40–60 кВт, что подразумевает уже совсем другой класс инженерных решений.
Меньше стоек – больше мощность?
Эффективно трансформировать уже функционирующие ЦОД для размещения серверов ИИ практически невозможно: им просто негде взять дополнительную мощность. Единственное решение – увеличить плотность существующих стоек за счет сокращения их количества.
Если убрать, условно, 100 классических стоек и поставить вместо них 10 высоконагруженных, место освободится, а совокупная мощность ЦОД останется той же. 10 стоек будут получать то же количество киловатт, что ранее получали 100. Однако это временное решение, которое не позволит масштабировать мощности в перспективе.
Вода и энергия: ключевые ресурсы для размещения ИИ
Нехватка мощности − далеко не единственная проблема ЦОД, желающего работать с ИИ-решениями. Одновременно «ломаются» и традиционные подходы к охлаждению. Воздушные схемы, которые хорошо масштабируются при умеренной плотности, упираются в пределы своих возможностей, а установить водяное охлаждение в существующих машинных залах или невозможно, или крайне затратно и сложно.
Также значительно усложняется система электропитания: растет и суммарная мощность, и требования к стабильности нагрузок. Как бы хорошо ни была подготовлена инженерная инфраструктура, сколько бы возможностей для отвода тепла ни было в ней заложено, без достаточного запаса по электричеству дата-центру не обойтись.
Резервирование: ложка меда в бочке дегтя
Генеративный ИИ ужесточает требования к доступной энергии и возможностям системы охлаждения, однако есть сфера, где ИИ упрощает жизнь инженерам ЦОД: резервирование.
Дело в том, что ИИ меняет характер нагрузки. В отличие от классических корпоративных систем и сервисов, где любой простой недопустим, ИИ-вычисления, как правило, не так уязвимы к нарушениям электроснабжения. При сбоях в вычислительных процессах не происходит потери данных, они достаточно легко восстанавливаются, поэтому на огромных мощностях, характерных для ИИ-проектов, классическое резервирование по схеме enterprise-ЦОД не только технически сложно, но и экономически нецелесообразно.
Четыре правила проектировании ЦОД под ИИ
Как бы ни старались дата-центры «старого образца», вечно «докручивать» схему питания и охлаждения под новые потребности у них не получится. Единственный выход − менять логику проектирования объектов. Питание, охлаждение, резервирование, компоновка машинного зала с учетом запросов ИИ должны рассматриваться не как независимые вспомогательные подсистемы, а как единая связаная архитектура.
Проектирование ЦОД под нужды искусственного интеллекта предполагает соблюдения нескольких важных правил:
- Изначально рассчитывать подведенную мощность под высокоплотные нагрузки: адаптироваться к ним в будущем не получится.
- Иметь запас по электричеству, так как потребности со временем будут расти.
- Предусмотреть архитектурный резерв: пространство должно иметь возможность для развертывания и масштабирования систем охлаждения, включая жидкостные.
- Проектировать инфраструктуру под конкретное техническое задание ИИ-проекта, а не под универсальную схему, рассчитанную на максимально жесткие SLA.
Все эти правила можно подвести под общий знаменатель: при проектировании новых дата-центров нужно закладывать пространство для маневра – и в архитектуре, и в подходах к резервированию, и в экономике проекта. Это позволит оптимизировать капитальные затраты и одновременно обеспечить готовность ЦОД к будущим вызовам.
Из большого города к источнику энергии: новая логика размещения ЦОД
Появление нового класса нагрузок обострило еще одну проблему − ограниченность внешнего энергоснабжения. Особенно чувствительны к ней дата-центры в больших городах из-за конкуренции за электричество с другими потребителями и отсутствия возможности провести новые линии питания.
С учетом этого обстоятельства можно предположить, что в будущем новые дата-центры все чаще будут строиться не на «перекрестках» максимального числа каналов, а как можно ближе к энергоисточнику – атомной, тепловой или гидроэлектростанции.
В качестве альтернативы переезду операторы ЦОД также рассматривают генерацию собственной энергии. Международные гиганты – такие, как Amazon, Google и Microsoft – уже ведут работы в этом направлении. Чуть менее фантастическая перспектива – использование собственной газогенерации.
Как ИИ влияет на индустрию ЦОД: много слов и мало дела
Из новостей можно сделать вывод, что генеративный ИИ радикально меняет рынок дата-центров. Но если смотреть на реальный спрос, картина выглядит скромнее. Большинство представителей бизнеса пока еще выжидает, наблюдая за первыми результатами внедрений. Многих отпугивает высокая стоимость оборудования и отсутствие опыта взаимодействия с ИИ.
Искусственный интеллект еще не стал массовым клиентом для коммерческих ЦОД в России. Наплыва желающих получить высоконагруженное стойко-место под технологии машинного обучения пока не наблюдается.
Согласно исследованию Uptime Institute, хотя плотность мощности в стойках продолжает расти, в среднем она находится на уровне 10–30 кВт. В Uptime Institute уверены, что лишь немногие проекты используют стойки мощностью более 30 кВт, но «экстремальные» плотности пока встречаются довольно редко.
Безусловно, искусственный интеллект подогревает рынок ЦОД, но цены растут и без него. Это объективный процесс, и его основные причины – дефицит мощностей, рост стоимости строительства, инженерных систем и подключения к электросетям. Генеративный ИИ в этой картине – катализатор спроса, но не его источник.
Перспективы ИИ в ЦОД
Отсутствие массового ИИ-клиента в коммерческих дата-центрах не означает отсутствия ИИ как такового. Крупные технологические игроки уровня Яндекс и Сбер уже используют искусственный интеллект как сервис для конечных пользователей, но оборудование для его поддержки при этом остается внутри. Однако по мере роста аудитории и вычислительных нагрузок корпоративная инфраструктура неизбежно упрется в пределы масштабирования, так как строительство и эксплуатация высокоплотных ИИ-мощностей – непрофильный бизнес для компаний, чья основная модель – цифровые сервисы. Это лишь вопрос времени. Дата-центры должны быть готовы к этому сценарию, даже если сейчас спрос на высокоплотные стойки невелик.
Подготовка инфраструктуры под ИИ – не очередной виток эволюции существующих принципов проектирования и эксплуатации ЦОД, а полноценная смена парадигмы, к которой рынок только начинает адаптироваться. Вопрос не в том, будет ли спрос, а в том, когда он станет коммерчески значимым.
