Наиболее частые проблемы при эксплуатации
инженерной инфраструктуры ЦОД включают
отказы системы гарантированного
электропитания, отказ системы
кондиционирования, затопления, а также
влияние человеческого фактора. Чтобы
минимизировать риски, используются системы
комплексного мониторинга инженерной
инфраструктуры, которые способны выявлять
даже незначительные отклонения в работе
оборудования, а также незамедлительно
оповещать персонал о возникновении
аварийных ситуаций. В статье
рассматривается пример реализации
комплексной системы мониторинга на
действующем ЦОД заказчика, которая
осложнялась наличием уже установленного
оборудования разных производителей, а
также приводятся аргументы в пользу
реализации полнофункционального
мониторинга, включающего мониторинг
энергетической части (силовых вводов, ИБП,
АКБ, ДГУ), мониторинг климатических режимов
и микроклимата в помещениях ЦОД, а также
элементов общего мониторинга, например,
охрана, авторизация на объекте, контроль
затопления.
Центральной проблемой инженерной
инфраструктуры ЦОД является отказ системы
гарантированного электроснабжения.
Последствиями такого отказа может быть
недоступность или потеря информации в ЦОД,
некорректное завершение работы серверного
и сетевого оборудования и значительный
простой ЦОД, который влечет за собой не
только финансовые, но и репутационные
риски. Чтобы минимизировать риски,
используются системы мониторинга
энергетической инфраструктуры, которые
способны выявлять даже незначительные
отклонения в работе источников
бесперебойного питания, аккумуляторных
батарей и дизель-генераторной установки, а
также незамедлительно оповещать персонал о
возникновении аварийных ситуаций. В статье
рассматривается пример реализации системы
мониторинга энергетической инфраструктуры
на действующем ЦОД заказчика.