
Ростом Маргиев, директор по сервису IXcellerate
Собственная сервисная служба IXcellerate появилась в 2024 году. К этому моменту компания эксплуатировала четыре ЦОД в двух кампусах и более 8000 стойко-мест, а уход с российского рынка ключевых вендоров заставил перейти к мультивендорной стратегии — далеко не каждый поставщик способен был поддерживать своё оборудование в России на нужном уровне. За полтора года команда выросла до более чем пятнадцати инженеров и техников, и сегодня её зона ответственности заметно шире классического техобслуживания ИБП, дизель-генераторов и систем охлаждения. Среди новых направлений — входной контроль поставляемого оборудования.
Любой человек, имеющий даже косвенное отношение к технологической сфере знает, чем занимается сервисная служба в индустриях, где требуется поддержка оборудования, – техническим обслуживанием и ремонтом. Дата-центры не исключение, только условия жёстче: здесь тоже ремонтируют оборудование, только в условиях повышенной нагрузки и требований к надежности.
Сервисная служба IXcellerate отвечает за качественное проведение ТО и поддержание в исправном состоянии критически важных элементов инфраструктуры ЦОД. Её прямая обязанность – обеспечить стабильную работу электрического, механического оборудования и функционирование программного обеспечения. Не менее важно — быстро реагировать на отказы и инциденты.
При обнаружении неисправности задача усложняется многократно в связи с тем, что у дата-центра уровня надежности Tier III все ремонты и обслуживание проводятся без остановки инженерных систем. Любой компонент системы электропитания или охлаждения нужно отключить, отремонтировать, заменить или модернизировать, не прерывая работу ЦОД.
Инженеры и техники сервисной службы IXcellerate выполняют множество функций, в том числе:
- плановое техническое обслуживание;
- мониторинг и поддержка работоспособности систем;
- диагностика оборудования;
- сопровождение пусконаладочных работ,
- разработка мер по снижению повторного возникновения отказов;
- документирование и стандартизация процессов на основе накопленного опыта и т. д.
Это довольно широкий фронт работ, и он не исчерпывается ТО и ремонтами. В нашей компании работа сервисных специалистов начинается задолго до того, как оборудование запускается в эксплуатацию.
Профилактика вместо ремонта: входной контроль оборудования в ЦОД
Чтобы минимизировать риски простоя, наши сервисные инженеры поддерживают надежность систем с помощью превентивных мер, прежде всего – входного контроля оборудования. Многие элементы инженерной инфраструктуры, поставляемые в дата-центр и требующие проверки до начала монтажа и ввода в эксплуатацию, проверяются непосредственно на площадках IXcellerate.
Важным шагом стало расширение входного контроля на вентиляторы системы охлаждения — узлы, которые должны работать в режиме непрерывной круглосуточной нагрузки. Их скрытые производственные дефекты необходимо выявить на самом начальном этапе. Инструментом мы выбрали вибродиагностику — неразрушающий метод оценки технического состояния роторных машин. По характерному виброспектру он позволяет распознать дефекты подшипников, дисбаланс крыльчатки, нарушения соосности и другие скрытые проблемы задолго до того, как они проявятся в работе.
Вибродиагностика: разработка унифицированных принципов
Во многих отраслях вибрация — это «язык», на котором машина сообщает о своём состоянии. ЦОД уровня Tier III с гарантированной доступностью 99,982% стоит в одном ряду с критическими промышленными объектами, поэтому аналогичные практики диагностики постепенно становятся стандартом и в нашей индустрии.
| Отрасль | Применение |
| Авиация | Вибродиагностика газотурбинных двигателей и вспомогательных силовых установок |
| Энергетика | Непрерывный мониторинг турбогенераторов и питательных насосов на АЭС и ТЭС |
| Тяжёлая промышленность | Предиктивное обслуживание компрессоров, редукторов и насосных агрегатов |
| Железные дороги | Диагностика колёсных пар, тяговых двигателей и букс |
| Фармацевтика | Квалификация вентиляционного оборудования чистых помещений по требованиям GMP |
Прежде чем внедрять метод в сервисную практику приёмки, нужно было выработать унифицированные критерии, применимые к любым будущим поставкам вентиляционного оборудования, независимо от вендора и партии. По итогам этой работы сервисная команда:
- определила базовый уровень вибрации для исправных вентиляторов;
- установила критерии оценки и предельные значения вибрации;
- обобщила полученные измерения по множеству аналогичных агрегатов;
- выработала методы и параметры измерений, порядок регистрации данных и критерии отбраковки.
Сегодня все охлаждающие вентиляторы проходят предварительную вибродиагностику. Если верхний допустимый порог вибрации превышен, агрегат подвергается динамической балансировке либо подлежит замене. Как этот подход работает на практике — лучше всего показывает первый кейс, на котором отрабатывалась процедура.
Кейс: серия отказов из партии ЕС-вентиляторов
Год назад несколько вентиляторов системы охлаждения, поставленных одним из китайских производителей EC-вентиляторов[1], вышли из строя менее чем через шесть месяцев после установки. Для оборудования с расчётным сроком службы более десяти лет — это аномалия. Их остановили по аварийным нарядам из-за сильного шума, гула и люфта крыльчатки. Разборка показала, что у нескольких агрегатов оказался поврежден вал ротора.
Углубленный анализ выявил две самостоятельные, но связанные причины:
- некачественные подшипники, которые быстро разрушались и приводили к заклиниванию узла;
- некачественная балансировка крыльчатки — многие вентиляторы из партии работали с уровнем вибрации, кратно превышающим медианные значения выборки.
Обе причины — это заводские дефекты, а не следствие условий эксплуатации. Многие агрегаты работали с повышенной вибрацией с первого дня, но проблема оставалась скрытой, пока подшипники не деградировали до критического уровня. И именно вибрация — то общее, через что проявлялись оба дефекта.
Возможно, кому-то такие меры могут показаться избыточными, но на самом деле они играют существенную роль в обеспечении надежности дата-центра, особенно если речь идет об элементах системы кондиционирования.
Риски неконтролируемой вибрации
Вентиляторы системы охлаждения работают в режиме непрерывной круглосуточной нагрузки и относятся к наиболее нагруженным узлам инженерной инфраструктуры ЦОД. Любой их отказ — это не просто инцидент с оборудованием. Это угроза параметрам климата в машзале и тепловому режиму для вычислительной инфраструктуры. Перегревы ведут к остановке серверов клиентов — прямому нарушению SLA[2].
При систематической работе с повышенной вибрацией происходит следующее:
- Развивается прогрессирующая деградация подшипников, повреждаются посадочные места в статоре и на валу ротора. Процесс идёт незаметно и завершается отказом вентилятора в момент пиковой тепловой нагрузки — когда резервирование системы охлаждения наиболее критично.
- Кратно сокращается ресурс агрегатов. То, что должно служить десятилетие, выходит из строя за год.
- Вибрация передаётся через опорные конструкции на соседнее оборудование, фальшпол, кабельные трассы, монтажные рамы стоечного оборудования и провоцирует резонансы в узлах, не рассчитанных на динамическую нагрузку. Проблема перестаёт быть локальной.
И это далеко не все потенциальные проблемы, поэтому пусконаладка в дата‑центре — это не просто «включили‑запустили‑работает», а критически важный этап с жёсткими требованиями к надёжности и безопасности.
Экономика превентивных мер
Вибродиагностика является одним из направлений предиктивного контроля и позволяет обнаружить дефекты оборудования до появления основных признаков деградации, когда замена ещё не является аварийной. Это один из этапов многоуровневого протокола пусконаладочных и приёмочных испытаний, которому подвергаются инженерные системы наших объектов. Такой подход позволяет исключить риски, связанные с временным снижением уровня резервирования, и гарантирует непрерывность и надежность услуг.
Другими немаловажными преимуществами входного контроля являются экономия времени и бюджета. Устранение дефектов на старте позволяет избежать более серьезных поломок в процессе эксплуатации, которые отвлекают силы специалистов и могут привести к простоям и нарушению установленного графика работ. Как известно, любое незапланированное вмешательство сопряжено с рисками для нормированного времени восстановления. А контроль параметров на этапе приемки радикально дешевле любого инцидента в процессе эксплуатации.
