В начале 1990-х в США группа единомышленников начала собирать информацию об инфраструктуре критических объектов, обеспечивающих обработку и хранение данных. Систематизация накопленной информации позднее позволила классифицировать данные объекты как дата-центры, а на основе данной классификации была построена система оценки с точки зрения потенциальной производительности инфраструктуры или времени безотказной работы.
Разработчики классификации составили костяк компании Uptime Institute, а их наработки впоследствии легли в основу современных международных стандартов и систем сертификации.
Uptime Institute (UI) разработал схему классификации центров обработки данных, основанную на четырех различных уровнях «Tier» (Tier I – Tier IV).
ЦОД различного уровня Tier отличаются степенью надежности и возможностью безостановочной работы, которые подразумевают обеспечение резервирования элементов объекта.
Одним из основных является понятие «резервирование», определяемое как «способ обеспечения надежности объекта за счет использования дополнительных средств и/или возможностей сверх минимально необходимых для выполнения требуемых функций». Существуют различные схемы резервирования, которые могут описываться формулой N + R (где N – число необходимых для нормальной работы модулей (Need), а R – число избыточных модулей (Redundant)) или выражаться как кратность резерва (XN).
На практике применяют разные схемы резервирования, например N, N + 1, N + 2, 2N, 2N + 1, 2(N + 1), (3/2)N, (4/3)N и т. п.
Какие существуют уровни Tier?
Уровни обеспечения надежности идут по возрастанию от Tier I к Tier IV, при этом каждый последующий уровень включает в себя требования предыдущего.
Четыре уровня Tier определяются следующими основными критериями:
- уровень резервирования инженерной инфраструктуры дата-центра;
- наличие возможности проведения регламентных и ремонтных работ оборудования без остановки работы дата-центра;
- наличие нескольких путей распределения электроэнергии до ИТ-нагрузки и нескольких контуров в системе охлаждения;
- реализация требований по физическому размещению компонентов инфраструктуры, автоматизации и непрерывности работы определенных систем.
Изначально классификация по уровням Tier также оговаривала допустимое суммарное время простоя дата-центра в год и уровень отказоустойчивости в процентах:
- TierI – Максимально допустимое годовое время простоя ЦОД – 28,8 часов, уровень отказоустойчивости – 99,671 %;
- TierII – Максимально допустимое годовое время простоя ЦОД – 22 часа в год, уровень отказоустойчивости — 99,749 %;
- TierIII – Максимально допустимое годовое время простоя ЦОД не превышает 1,6 часа в год, уровень отказоустойчивости – 99,982 %;
- TierIV – Максимально допустимое годовое время простоя ЦОД не более 26 минут в год, уровень отказоустойчивости 99,995 %.
Однако уже в 2008 году Uptime Institute отказался от этих параметров, поскольку данные величины являются лишь математическим ожиданием – теоретическим расчетным показателем, никак не отражающим реальной работы дата-центров, функционирующих непрерывно на протяжении многих лет.
Уровень Tier I
Уровень Tier I предполагает, что инфраструктура ЦОД включает необходимый минимум для обеспечения работы ИТ-систем: источник(–и) бесперебойного питания, систему охлаждения дата-центра и генератор для обеспечения ИТ-оборудования электроэнергией.
Уровень Tier II
Уровень Tier II предполагает, что инфраструктура ЦОД имеет резервирование активных элементов критически важных систем электропитания и охлаждения, включая такие компоненты, как ИБП, чиллеры, кондиционеры, насосы, ДГУ и пр.
Уровень Tier III
Уровень Tier III подразумевает, что инфраструктура ЦОД построена таким образом, что позволяет ИТ-нагрузке работать непрерывно при параллельном проведении плановых работ по техническому обслуживанию инженерного оборудования. Это достигается за счет обеспечения возможности выведения любого элемента инфраструктуры (включая кабельные трассы, щиты, трубопроводы, задвижки, автоматы и пр.) на плановое обслуживание путем использования аналогичного резервного элемента.
Уровень Tier IV
Инфраструктура уровня Tier IV в дополнение к требованиям Tier III, также требует принятия дополнительных мер по обеспечению отказоустойчивости: секционирования по R элементов (то есть разнесения по отдельным помещениям по R единиц оборудования) на случай пожара, затопления и т. п.; обеспечения непрерывного охлаждения; автоматизации с целью обеспечения возможности локализации любого единичного отказа, изолирования отказавшего узла и воспрепятствования каскадному распространению последствий отказа далее по системе.
Подробное описание уровней Tier было изложено в стандарте Tier Standard: Topology, выпущенным Uptime Institute в 2008 году. Текст стандарта можно скачать с интернет-сайта компании. Сама же классификация легла в основу других стандартов, ныне используемых в отрасли.
Затраты на инфраструктуру центра обработки данных и эксплуатационная сложность возрастают с увеличением уровня Tier. Выбор Tier зависит от бизнес-требований заказчика, а также от модели организации ИТ-инфраструктуры. Нельзя однозначно сказать, что решение уровня Tier IV лучше, чем решение уровня Tier II; ИТ-инфраструктура, опирающаяся на несколько ЦОД уровня Tier II или Tier III, может оказаться более оправданной с экономической точки зрения, нежели построенная на одном (двух) центре обработки данных уровня Tier IV.