среда, 2 июля 2014 г.

Как работает инженерная служба КРОК — и что происходит, если в 3 ночи где-то далеко ломается кластер @habrahabr





DL360 — сервер на Pentium I под горячую замену. Где-то далеко в Сибири под постоянной нагрузкой уже много лет трудится его брат-близнец. Если он выйдет из строя, у нас есть замена, позволяющая просто продолжить работу без кардинальной перенастройки





А вот с такой картины часто начинается утро на выезде



Доброе утро! Меня зовут Александр, я работаю руководителем сервисной команды КРОК.



По всей стране есть много объектов, где выход из строя кластера сразу ведёт к попаданию местного главного в телевизор. Это разные НИИ, промышленные предприятия, узлы банков, страховых, объекты нефтяных компаний, аэропорты и так далее. А мы ставим туда железо, софт и всё это держим на поддержке.



Начнём с того, что монтажей без приключений почти не бывает. Хорошо, если нам просто забыли дать питание или сеть. Хуже, когда серверная стойка стоит снаружи здания, потому что кто-то неправильно указал размеры двери. Ещё бывают моменты вроде: «Парни, мы всё подготовили, подключили, только есть нюанс — ваш сервер при разгрузке уронили. Ну, всего пару раз». Сейчас я расскажу и покажу, как выглядит наша работа. Читать дальше →



via Хабрахабр / Захабренные / Тематические / Посты http://ift.tt/1qpaLth

Комментариев нет:

Отправить комментарий