Коронавирус стал причиной потопа в серверной

Статьи 1 апреля 2022 Автоматизируй это! Четыре бизнес-процесса, где нельзя обойтись без Service Desk. Когда компания растет, увеличивается и количество запросов от пользователей. Однажды это превращается в «снежный ком»: техподдержка не справляется с потоком, заявки теряются, время обработки обращений все дольше, пользователи недовольны. Знакомая ситуация? Тогда нужно срочно внедрять ServiceDesk. Разбираемся, чем может помочь эта система, и какие направления стоит автоматизировать в первую очередь.
Новости 30 марта 2022 Телфин — российский провайдер IP-телефонии для бизнеса

25 марта мы посетили мероприятие компании Телфин.

На встрече коллеги рассказали о новых и актуальных сервисах и преимуществах взаимодействия провайдера IP-телефонии и IT компаний.

Статьи 24 марта 2022 Как компаниям реагировать на санкции в IT Российский бизнес столкнулся с новой реальностью. За короткий промежуток времени на нас обрушились сотни санкций и ограничений. Они «бьют» по самым разным сферам деятельности, в том числе по IT. И ощущают это не только профильные компании, но и те, для кого IT-инфраструктура является вспомогательной. Делимся советами, которые мы даем своим клиентам.

Как мы за 3 дня устранили последствия ЧП в офисе клиента.

ИТ-аутсорсинг – это не только регламенты, ежедневная поддержка и стандарты соглашения об уровне обслуживания. Иногда приходится мобилизовывать все ресурсы, чтобы решить срочную проблему клиента.

Так произошло с одним из наших заказчиков – успешной производственной компанией, которая в этом году переехала в новый офис. В результате ЧП из строя была полностью выведена вся ИТ-инфраструктура, работа была парализована, бизнесу грозили убытки. Вот что мы сделали, чтобы всего за 3 дня полностью восстановить работу!

Тонкости переезда

Компания N (назовем ее так, чтобы не раскрывать настоящее название) - один из постоянных клиентов ALP ITSM. К моменту ЧП мы уже на протяжении 4 лет занимались ИТ-поддержкой компании: следили за состоянием серверного и сетевого оборудования, обеспечивали работоспособность сервисов, консультировали пользователей.

Все шло хорошо. Компания успешно развивалась, набирала новых сотрудников и несколько раз переезжала во все более просторные офисы. Каждый раз при переезде мы помогали развернуть ИТ-инфраструктуру на новом месте. Делали все максимально оперативно – старались приурочить переезд к выходным, чтобы уже в понедельник сотрудники могли выйти на новые места, полностью подготовленные с точки зрения ИТ.

Последний переезд ничем не отличался от предыдущих. Заказчик решил оборудовать в офисе специальную серверную комнату. Подрядчиком выступала другая компания, однако ее сотрудники постоянно консультировались с ALP ITSM по вопросам размещения оборудования. Как выяснилось впоследствии, почти все наши рекомендации были учтены - за исключением одного единственного пункта, который и стал «роковым».

День Х

С момента переезда в новый офис прошло несколько месяцев. Все шло хорошо, оборудование стабильно работало.

Однако в июле 2021 года один из сотрудников заболел коронавирусом. Чтобы обезопасить остальной персонал, в офисе решили провести дезинфекцию. Одно из распространенных решений в этом случае – обработка помещения специальным паром.

Вызвали бригаду, которая вечером, после ухода сотрудников, начала проведение дезинфекции. Все помещения (за исключением серверной, которая была изолирована от основных помещений) были отключены от датчиков пожарной безопасности. Пространство офиса заполнили паром и в таком состоянии он был закрыт на ночь.

Когда следующим утром сотрудники пришли на работу, оказалось, что в офисе не работает ни телефон, ни интернет, не функционирует ни один ИТ-сервис. Штатные ИТ-сотрудники направились в серверную и обнаружили, что все оборудование залито водой. Они связались с командой ALP ITSM, чтобы оперативно разобраться в причинах и, самое главное, восстановить оборудование.

Что же произошло?

Как выяснилось позже, одной из главных причин ЧП стали особенности прокладки вентиляционных каналов в офисе. Предполагалось, что серверная комната полностью изолирована от остальных помещений, однако на деле это оказалось не так: пар проник внутрь серверной комнаты через вентиляционные решетки.

Затем пар вызвал реакцию пожарных датчиков – по стечению обстоятельств, именно в серверной комнате они не были отключены в отличие от всего остального офиса. И хотя во время консультаций при строительстве серверной комнаты мы рекомендовали использовать газовое пожаротушение, подрядчик не прислушался к этой рекомендации и использовал жидкостное средство пожаротушения. В итоге после того, как сработали пожарные датчики, вся серверная комната оказалась залита водой. О том, чтобы сохранить работоспособность оборудования, не было и речи.

План А и план Б.

Как только заказчик сообщил нам о проблеме, в его офис выехала группа «оперативного реагирования» из нескольких человек.

Мы сразу же разделили работу на два направления:

  1. Диагностика состояния оборудования в серверной. Нужно было попытаться спасти то, что еще можно было спасти.
  2. Поиск обходных решений, чтобы восстановить работоспособность офиса как можно быстрее.

Заказчику такой подход понравился, он нам дал «зеленый свет» на проведение всех работ.

koronavirus-stal-prichinoy-potopa-v-servernoy

Работу части оборудования, которая не сильно пострадала от воды, нам удалось восстановить в тот же день. Заработала телефония, интернет, 1С. Одновременно мы связались с сервисным центром, чтобы заменить ту часть оборудования, которую восстановить было уже невозможно.

Параллельно мы занимались восстановлением информации, которая была на серверах перед инцидентом. В этом сильно помогли резервные копии, которые хранились за пределами офиса (это хорошая практика, мы рекомендуем так поступать всем клиентам). Инцидент произошел накануне выходных дней, и за эти дни мы развернули копии в нашем облаке. Также удалось сделать слепок ИТ-инфраструктуры.

В итоге к понедельнику мы восстановили всю инфраструктуру, все технические сервисы были доступны. Основная задача была решена.

В течение следующей недели были проведены отладочные работы, так как сбой работоспособности был очень резким, потребовалась консультация пользователей и дополнительная поддержка.

Какие выводы сделали мы и заказчик?

Как бы тщательно вы ни продумывали защиту серверной комнаты, от ЧС не застрахован никто. Поэтому всегда полезно помнить о нескольких ключевых вещах, которые позволят быстрее преодолеть подобные инциденты.

  1. Обязательно должна быть внешняя резервная копия. Если бы
    у заказчика ее не было в наличии, восстановить информацию
    было бы на порядок сложнее.
  2. Не стоит держать все «в одной корзине». Закрытый периметр не гарантирует 100% безопасности. Разумно часть информации перенести в облако. Это обеспечит работоспособность сервисов, даже если что-то произойдет с сервером компании.
  3. Нужно заранее продумать план действий сотрудников на случай выхода из строя серверов. Это позволит не терять времени на эмоции, преодолеть растерянность и сразу же приступить к поиску решения.

Свежие новости и статьи