«Самолет» перешел на новую отказоустойчивую корпоративную ИТ-инфраструктуру

3 апреля 2024 г.

Группа «Самолет» перевела все корпоративные ИТ-системы на новую отказоустойчивую модель, которая гарантирует работоспособность и полную защиту данных от потерь в случае чрезвычайной ситуации. Уровень доступности инфраструктуры равен 99,95%. Информационные системы компании зарезервированы на базе двух центров обработки данных (ЦОД), объединенных в метрокластер. Всего это более 400 систем и приложений, которые используются для обеспечения ежедневной работы «Самолета», и около 2,4 ПБ данных — финансовые данные, HR и CRM-системы, данные по строительным процессам, информация о клиентах.

Проект по созданию современного и надежного инфраструктурного решения занял один год. Поскольку перед специалистами «Самолета» стояла задача создать отказоустойчивую систему в режиме онлайн, то выбор был сделан в пользу построения метрокластера.

Первым этапом стало проектирование дата-центров, сетевой инфраструктуры, инфраструктуры хранения данных, выбор технологий и оборудования. Архитектура метрокластера реализована на базе решений Hitachi и Huawei, виртуализация сделана на основе VMWare. При организации СХД использовалась технология SAN, которая позволила вывести решение задач резервирования, восстановления данных и масштабирования на стабильно высокий уровень за счет большой скорости передачи данных и минимальной потери производительности. Параллельно с этим прорабатывалось размещение в колокейшн ЦОДов, которые отвечали нашим техническим требованиям, проводились основные и резервные каналы связи между дата-центрами и центральным офисом. Оба дата-центра являются активными, и их ресурсы доступны в штатном режиме.

На последнем этапе наращивались и выравнивались мощности между ЦОДами, чтобы при отказе одного второй мог обеспечить нормальное функционирование продуктовых сервисов «Самолета». В периоды пиковых нагрузок компания сможет поддерживать высокую доступность своих сервисов, не увеличивая время ожидания сотрудников и клиентов. В случае сбоя переключение внутри кластера виртуализации происходит в течении нескольких секунд, без потери данных и, как правило, незаметно для пользователя. Причины сбоя в работе ЦОД могут быть различны — от аварии на линии электропередач до человеческого фактора, но правильно выстроенная инфраструктура обязана обеспечить бесперебойную работу.

Еще один важный момент — гибридная инфраструктура, которая построена так, чтобы можно было добавлять мощности по мере необходимости: в рамках резерва они могут быть предоставлены в течение часа, новые мощности могут быть организованы в течение четырех часов.

«„Самолет“ получил современную, безопасную и отказоустойчивую ИТ-инфраструктуру. Базовое значение доступности инфраструктуры для нас сегодня 99,95, но, безусловно, цель — 99,99. Для своих проектов мы отбираем лучшие практики и решения на рынке. Например, используем технологию SAN, которая обеспечивает одновременное и синхронное копирование данных; реализована возможность кроссцодового использования мощностей, настроен обязательный бэкап данных по всем продакшн-системам. Сегодня по уровню инфраструктуры „Самолет“ — в числе первых в отрасли, но мы не стоим на месте, а постоянно развиваемся и совершенствуемся: обновляем парк серверов и сетевое оборудование. В ближайших планах также внедрение практики управления финансами в ИТ (ITFM), что позволит правильно оценивать стоимость сервисов, которые мы предоставляем внутренним пользователям и бизнес-юнитам, и эффективно планировать экономические аспекты», — рассказал Алексей Семенов, руководитель управления ИТ-инфраструктуры и сопровождения сервисов «Самолет».

Источник: Пресс-служба компании «Самолет»

Россия