Нагрузочные испытания ЦОДа позволяют обнаружить потенциальную проблему до того, как она проявила себя ошибками, сбоями и отказом ключевых систем. Но эффективность и ценность испытаний прямо пропорциональна качеству их проведения.
Как организовать процесс так, чтобы получить максимальную отдачу?
Методика — база НИ
Для каждого конкретного ЦОДа необходимо разработать индивидуальную методику. Она будет необходима при каждом проведении НИ, с течением времени в первоначальный документ могут вноситься корректировки.
Методика решает несколько важных задач.
- Во-первых — гарантировать безопасность НИ.
Нельзя просто случайным образом выводить для тестирования ту или иную систему. Необходимо заранее рассчитать последовательность и процедуру проверок, чтобы испытания не повлияли на работу всего дата-центра. Кроме того, методика должна предусматривать планы быстрого восстановления на случай сбоев. Это особенно важно для ЦОД, которые эксплуатируются долгое время и давно не проходили проверки.
- Во-вторых — обеспечить результативность НИ.
Можно использовать самый простой подход. Например, для ИБП: вывести из эксплуатации, перевести в режим работы от батареи, замерить время работы, зафиксировать и включить опять. Очень простая методика — записывается только время автономной работы. Достаточно ли этого? На самом деле это покажет только то, что на текущий момент все нормально.
Главная цель НИ — убедиться, что все будет нормально и дальше, до следующего года, до следующего испытания. В том же примере с ИБП — нужно использовать специальные инструменты, подключать их к разным участкам с разными условиями и смотреть, как он себя поведет.
Все этапы этого процесса для каждой системы должны быть прописаны в методике. Только так можно провести полное тестирование и детальную диагностику, чтобы увидеть потенциально проблемные участки.
Таким образом, полная и грамотная методика — едва ли не половина успеха. Ее подготовка потребует больших усилий от службы эксплуатации ЦОДа. Привлечение экспертов, специализирующихся именно на проведении НИ, позволит решить эту задачу быстрее и эффективнее. Наша команда готова помочь с разработкой методики.
Когда методика написана и согласована, остается решить — проводить ли испытания собственными силами, руководствуясь планом, или доверить реализацию специалистам с опытом в этом направлении.
Проведение НИ собственными силами
Что потребуется службе эксплуатации, чтобы провести нагрузочные испытания самостоятельно? Помимо методики, нужен комплекс оборудования, которое будет имитировать различные условия работы, повышая нагрузку до максимальных значений:
- нагрузочная машина (мощностью 1 МВт и выше) для подключения к ИБП и генератору,
- тепловые пушки для проверки системы охлаждения,
- программно-аппаратные комплексы с диагностическими функциями для оценки результатов
и другие устройства, в зависимости от комплектации ЦОД.
Приобретение такого оборудования имеет смысл для владельцев крупных или нескольких ЦОД, при высокой частоте тестирований. Если наполнение не очень велико, испытания требуются не чаще раза в год — выгоднее воспользоваться арендой.
Взять в аренду оборудование для НИ можно в нашей компании. Мы предоставим не только сами машины в удобном мобильном исполнении, но и все нужные комплектующие — кабели подключения, автоматы защиты и т.д.
Кроме того, оказать поддержку могут и наши инженеры — в том объеме, который вам требуется. Например, если в службе эксплуатации есть только ИТ-специалисты, на испытания может выехать наш электрик с соответствующими допусками и опытом в сфере ЦОД.
Если потребуется, мы можем взять на себя весь процесс НИ, предоставив и оборудование, и команду специалистов.
Привлечение специалистов по НИ
Тонкий вопрос: зачем привлекать сторонних специалистов, если есть собственная служба эксплуатации?
Разница — в профильной квалификации и опыте, которые играют большую роль и в процессе проведения самого НИ, и в качестве его результатов.
Грамотный ИТ-специалист с опытом обслуживания ЦОД может пройти обучение, получить некоторый объем знаний и провести необходимые операции. Но, выполняя эти работы раз в год, нельзя разобраться во всех тонкостях и накопить опыт.
В процессе НИ необходимо использовать разное оборудование, замерять множество параметров. Данные, которые выдает программно-аппаратный комплекс, нужно сопоставить и проанализировать.
Простая аналогия: диагностика автомобиля. Автолюбитель, имеющий представление об устройстве двигателя или ходовой, может заняться поиском проблемы с помощью инструкций. В конце концов он ее найдет — потратив уйму времени на чтение документации и перебрав всю систему. Тогда как мастер в автосервисе поймет, где искать, сразу как получит информацию о “симптомах”.
Точно так же специалист, который занимается НИ каждый день, посмотрит глубже и заметит больше. Он обратит внимание на те контрольные точки, которые являются критически важными, больше подвержены износу или сильнее влияют на результат.
Техника становится все более умной — диагностические машины выдают много данных. Но оборудование не может протестировать само себя: финальный уровень аналитики и понимания ситуации все еще лежит на инженере. Два специалиста могут смотреть в один и тот же лог-файл. Один увидит отдельные отклонения, а другой — последовательность сигналов, которые говорят об определенной проблеме. Такой уровень понимания дает только опыт.
Еще один нюанс связан с выбором решений. Специалист, который редко сталкивается с проблемой, чаще всего останавливается на точечной замене деталей. Опытный инженер знает, что иногда замена отдельной детали бессмысленна: проблема шире, и только замена узла предотвратит поломки в будущем.
Для примера — распространенная ситуация. Инженер меняет батарею ИБП, не меняя при этом износившиеся конденсаторы в машине постоянного тока. Пульсации продолжаются и изнашивают новую батарею, сокращая срок ее службы с пяти лет до двух.
Другой случай — замена конденсаторов выходного фильтра, которые подогревают дроссели. Этого недостаточно, дроссели все равно выйдут из строя.
Ну и простейший пример, когда меняют часть батареек из массива, ошибочно считая, что это продлит срок службы.
Это лишь три примера из нашей практики. Опытный специалист, столкнувшийся с множеством возможных ситуаций, знает сотни таких деталей. По инструкциям получить эти знания невозможно.
Как мы проводим НИ?
Тестирование занимает в среднем от 1 до 4 часов на каждый тип оборудования. С учетом времени на подключение диагностических систем, за день мы проверим 2-4 устройства. Общая продолжительность НИ зависит от масштаба ЦОД — от 1 дня до недели.
По итогам испытаний заказчик получает подробный отчет. В нем указаны все показания, которые были сняты. Приведены осциллограммы, отражающие поведение оборудования при тех или иных режимах. Сформулированы выводы, работает ли устройство в штатном режиме или замечены отклонения от нормы.
Инженер дает письменные рекомендации: как устранить проблемные места, какие компоненты заменить, чтобы привести систему в оптимальное состояние. Например, если мы обнаружили, что батарея под нагрузкой потеряла емкость, — сообщим, что в ближайший год ее нужно будет заменить.
Какой способ проведения испытаний выбрать? Решение всегда индивидуально и остается на усмотрении владельца ЦОДа и службы эксплуатации. Мы советуем помнить главное: качественные НИ необходимы для стабильной работы ЦОД, а экономия в итоге может обойтись гораздо дороже. Наша команда готова оказать помощь в любых объемах: разработать методику, предоставить оборудование, взять на себя весь процесс и нести ответственность за результат.