В лучшем случае владелец имеет опыт или хотя бы теоретические познания об эксплуатации, плановом сервисном обслуживании, профилактических работах. В штате таких компаний есть или служба эксплуатации инженерных систем, или, как минимум, ответственные за это исполнители, которые по своим служебным обязанностям представляют, какие действия необходимо предпринимать для безаварийной работы оборудования. А это кондиционеры, холодильные машины, циркуляционные насосы, источники бесперебойного питания, силовое электрооборудование, дизельные электростанции и многое другое.
Однако практика показывает, что во многих случаях это далеко не так. Первое время помогают исполнители, построившие дата-центр, особенно в период гарантийного срока на оборудование. Но вскоре происходит первая серьезная поломка, и они отказывают в гарантийном ремонте. Основанием является одна очень простая причина: на вышедшем из строя оборудовании не проводились плановые сервисные и профилактические работы, а значит, ни строители, ни производитель не несут ответственности за поломку. Она не является гарантийным случаем, так как «железо» эксплуатировалось ненадлежащим образом.
Суровый диагноз, который не сулит ничего хорошего. Что это значит для владельца дата-центра? Только одно – ремонт оборудования будет выполнен за его счет. Эти средства зачастую не были включены в бюджет расходов на эксплуатацию. Технические специалисты вступают в неравный бой с ответственными за финансовую часть. Эта первая ложка дегтя в бочке с медом. Идет время, число поломок растет, и дегтя все больше и больше, вкус меда забыт. Аварии случаются чаще, причем когда все спят, спокойных ночей меньше, проблем с восстановлением работоспособности оборудования – больше.
Поскольку идеальных дата-центров не существует, могут возникать и другие проблемы. Несмотря на то что на этапе проектирования закладываются решения для увеличения «прочности» ЦОД, очень часто имеются различные ограничения при реализации задуманного.
Казалось бы, что может повлиять на беспрерывную работу дата-центра, в котором наличествует двойной запас по холоду и электричеству? На его территории – топливное хранилище, обеспечивающее 48 часов работы имеющихся резервных дизельных электростанций или динамических ИБП. Что может быть надежнее? Но в один момент дата-центр останавливается, потому что его затопило. Источником потопа стала транзитная труба холодного водоснабжения прилегающего производства. Ее на этапе проектирования и строительства не удалось перенести за пределы стен ЦОД, так как хозяева территории не дали разрешения на остановку своего производства. Многоразрядные финансовые инвестиции в буквальном смысле смыло, и это не цунами, не тайфун, которые могут быть включены в статьи контрактов как форс-мажор. Дорогостоящее оборудование уничтожила просто проржавевшая труба под потолком, замаскированная конструкцией из гипсокартона.
Идет время, потребности компании растут, места в стойках для оборудования все меньше и меньше, а вместе с ним меньше электричества, холода, резерва, запаса прочности. Здесь может иметь смысл обратиться к специалистам исполнителя, отвечающим за жизнь ЦОД. На основании опыта эксплуатации конкретной площадки, знания всех положительных и отрицательных моментов разрабатываются решения, направленные на модернизацию систем для обеспечения надежной безостановочной работы комплекса сложного оборудования.
Наша многолетняя практика эксплуатации, сервисного обслуживания и технической поддержки оборудования инженерных систем позволяет определять комплекс мер по поддержанию и увеличению надежности ЦОД, прогнозировать и минимизировать риски возникновения аварий, обеспечивать сервисное обслуживание, соответствующее требованиям непрерывности бизнеса. Мы также помогаем оптимально модернизировать комплексы инженерных систем, а также развивать ЦОД в условиях существующих ограничений. Кроме того, мы можем определить объем инвестиций на ближайший период для поддержания безотказной работы ЦОД, а также оценить эффективность, качество и адекватность стоимости уже получаемых или предлагаемых услуг. Составление сервисного контракта, в том числе определение Service Level Agreement (SLA) происходит персонально для каждой компании, чтобы по итогам «ЦОД функционировал всегда, а проблемы решались быстро».
Риски остановки ЦОД есть всегда. Задачи эксплуатирующей или сервисной организации – грамотно взвесить их, спрогнозировать, заранее оповестить заказчика, определить список и порядок мероприятий, которые помогут снизить, а в идеальном случае полностью исключить их из жизни дата-центра. Взвешенный подход перед заключением контракта на сервисную и техническую поддержку, выраженный в подробном изучении всех проектных решений, аудите состояния оборудования на площадке, оценке рисков, прогнозировании неблагоприятных событий, планировании работ и мероприятий по их уменьшению, – это залог спокойных ночей как владельца дата-центра, так и технического персонала исполнителя.