Построить отказоустойчивую инфраструктуру
В инструкции рассматривается как повысить отказоустойчивость вашего сервиса на физическом уровне.
Отказоустойчивость — свойство сервиса сохранять работоспособность и продолжать выполнение бизнес-задач даже в случае выхода из строя отдельных компонентов IT-инфраструктуры.
Степень отказоустойчивости сервиса зависит от типа выполняемых задач. Необходимость повышения отказоустойчивости появляется, когда ущерб от простоя превышает затраты на обеспечение бесперебойной работы. Например, с помощью сервиса предоставляется непрерывный доступ к важной информации, или сама работа компании напрямую зависит от бесперебойной работы IT-инфраструктуры.
Что обеспечивает Selectel
Selectel обеспечивает отказоустойчивость вашего сервиса на уровне серверного зала, в котором стоят стойки с серверами. Для этого:
-
в серверный зал поступают вводы электропитания, зарезервированные на более высоких уровнях (трансформаторные подстанции Selectel; промышленные ИБП включающие АКБ; аварийный источник электроснабжения — ДГУ), далее, к каждой стойке подводится два независимых ввода питания:
- для серверов с одним блоком питания в стойки устанавливаются АВР (устройства автоматического ввода резерва), к которым подведены два независимых ввода питания, при отключении одного ввода электричество продолжит поступать по второму;
- для серверов с двумя блоками питания их подключение выполняется в два независимых блока розеток;
-
резервируется доступ к локальной и интернет-сети на уровне коммутатора агрегации (и выше), а также:
- для серверов готовой конфигурации в каждой стойке устанавливаются коммутаторы доступа для локальной сети и интернет-коммутаторы;
- для некоторых серверов Chipcore Line подключение к локальной сети отсутствует, в каждой стойке устанавливаются только интернет-коммутаторы;
- для серверов произвольной конфигурации резервирование подключения к нужной сети (локальной или интернет) определяете вы сами;
-
если есть техническая возможность, при заказе двух и более серверов они располагаются в разных стойках. Просмотреть текущее расположение серверов и отправить запрос на перенос сервера в другую стойку можно в панели управления, раздел Серверы и оборудование → Серверы, вкладка Расположение серверов.
Повыcить отказоустойчивость
Повысить отказоустойчивость клиентского сервиса на физическом уровне можно снижением количества вероятных точек отказа. При построении IT-инфраструктуры вероятными точками отказа могут стать:
- сам сервер и его комплектующие (диски, блоки питания, сетевые интерфейсы и пр.);
- АВР (устройства автоматического ввода резерва);
- коммутатор доступа в интернет и коммутация (медное и оптическое соединение, трансив еры, патч-корды и пр.);
- коммутатор доступа в локальную сеть и коммутация.
Повысить отказоустойчивость на уровне стойки
Для снижения количества вероятных точек отказа на уровне стойки можно:
- выбирать серверы произвольных и готовых конфигураций с серверными процессорами. В таких серверах все комплектующие оптимизированы под высокую нагрузку и бесперебойную работу и с меньшей степенью вероятности могут выйти из строя;
- использовать конфигурацию сервера с двумя и более блоками питания. Такой способ резервирования питания является более надежным, так как не имеет единой точки отказа. Выход из строя одного из блоков питания или АВР не приведет к отключению сервера;
- для серверов произвольной конфигурации резервировать подключение к коммутаторам доступа нужной сети (локальной или интернет) через MC-LAG;
- дублировать уже существующий сервер. При этом необходимо разместить серверы в разных стойках.
Повысить отказоустойчивость клиентского сервиса, состоящего из нескольких серверов
Для снижения количества вероятных точек отказа вашего сервиса, размещенного на нескольких серверах, можно:
- равномерно распределять нагрузку по серверам (для этих целей можно использовать отказоустойчивый балансировщик нагрузки);
- размещать серверы в разных стойках;
- размещать серверы в разных пулах и объединять их с помощью Глобального роутера Selectel.