В статье рассматривается влияние резервирования контроллера SDN сети предприятия на ее коэффициент готовности. Кроме того, производится исследование влияния интенсивности обнаружения отказов на надежность сети. На основании вычислений приходим к выводу о целесообразности использования резервирования в рассматриваемой сети.
Ключевые слова: надежность; интенсивность отказов; сеть предприятия; резервирование; SDN.
Программно-конфигурируемые сети (SDN) в настоящее время получают все большую популярность. На основе данной технологии возможно построение как магистральных сетей, так и сетей предприятия [1]. Ядро сети предприятия или отдельного крупного филиала в большинстве случаев строится с применением мощных маршрутизаторов и коммутаторов с обширным функционалом. Использование SDN при построении подобной сети позволит заменить совокупность этих устройств на обычный сервер и коммутаторы с более простым функционалом, но с поддержкой openflow. Целью данной работы является оценка влияние резервирования серверной инфраструктуры на отказоустойчивость сети предприятия в целом. В дополнении к этому, произведена оценка влияния среднего времени обнаружения отказа на надежность сети.
Предметом исследования является сеть предприятия, построенная с применением идеологии SDN, т. е. используются дешевые коммутаторы с минимальным функционалом, а все интеллектуальные задачи — управление, маршрутизация, фильтрация трафика, связь с внешними сетями посредством протокола маршрутизации BGP обеспечивается контроллером SDN — сервером или кластером серверов. Преимуществом использования более одного сервера является тот факт, что при отказе одного из серверов перерыва связи не произойдет.
Рис. 1. Исследуемая сеть предприятия
На рисунке 1 представлена схема исследуемой сети, которая состоит из контроллера SDN и коммутаторов. Контроллер SDN является самым технически сложным устройством в данной сети, при отказе контроллера связь с внешними сетями будет полностью отсутствовать. Экономически для подобной сети предприятия обосновано использование не более двух серверов, а в большинстве случаев одного, иначе теряется выгода перед традиционными сетями передачи данных [2]. Для связи с внешними сетями, включая интернет, филиалы и т. д. используются два маршрута: через автономные системы BGP 1 и 2. Будем считать, что в случае отказа одного из маршрутов, оставшейся полосы пропускания достаточно для нужд офиса.
Рассматриваемая сеть считается неработоспособной при отказе сервера или двух серверов (в случае с резервированием), при одновременном отказе коммутаторов SW1 и SW2. Принимая во внимание вышеупомянутые условия оценим характеристики надежности сети при использовании SDN в реализации без использования резервного сервера и с резервным сервером. Вычисления проводятся для марковского процесса с дискретными состояниями в непрерывном времени, время нахождения в одном состоянии распределено по показательному закону.
Ниже приведен список состояний, принимаемых системой. При отсутствии резервирования система неработоспособна в состояниях 4, 5 и 6. При использовании резервирования система неработоспособна в состояниях 6 и 7.
1 — отказы отсутствуют;
2 — один коммутатор вышел из строя;
3 –восстановление коммутатора при работоспособном сервере (совокупности серверов);
4 — отказ одного сервера;
5 — отказ одного коммутатора и одного сервера;
6 — восстановление контроллера SDN (ремонт серверов, перенастройка систем виртуализации. При этом параллельно возможно восстановление коммутатора, которое занимает меньшее, чем восстановление сервера временя);
7 — SDN-контроллер, состоящий из двух серверов полностью неработоспособен.
В таблице 1 представлены переходы между состояниями системы при отсутствии резервирования контроллера SDN:
Таблица 1
Переходы между состояниями системы
Переход |
Описание |
|
Система полностью работоспособна, происходит отказ коммутатора (коммутаторы используются как правило одинаковые, поэтому соответствующие интенсивности одинаковы, вероятностью одновременного отказа двух коммутаторов пренебрегаем. |
|
Система полностью работоспособна, происходит отказ сервера |
|
В рассматриваемой задаче принимаем во внимание случай, когда уже при имеющемся, но не обнаруженном отказе сервера или коммутатора происходит отказ коммутатора или сервера, соответственно. |
|
Если при отказавшем коммутаторе обнаруживается отказ, то переходим в состояние восстановления (ремонта) |
|
В ситуации, когда обнаружен отказ сервера (даже в совокупности с коммутатором), происходит переход в состояние восстановления сервера, при этом полагаем, что восстановление коммутатора, если она нужно, требует меньше времени, как бы происходит в фоновом режиме. |
|
Далее, происходит устранение отказов |
Объединив все состояния и переходы между ними получаем граф:
Рис. 2. Граф состояний сети предприятия
При резервировании контроллера добавляется состояние при котором совокупная система из серверов неработоспособна, например, программный отказ средств виртуализации Соответственно, принимаем, что время, затрачиваемое на восстановление совокупной системы требуется больше, т. е. λ2>λ1. Система попадает в состояние «Отказа двух серверов» при уже имеющемся одном отказе сервера. В данном случае делается два допущения:
В один момент времени может отказать один сервер;
Считаем, что время на восстановление коммутатора значительно меньше и проходит как-бы в фоне.
Рис. 3. Совокупная система из серверов неработоспособна
Переходы между состояниями происходят с интенсивностями, значения которых представлены в таблице 2.
Таблица 2
Значения интенсивностей
Обозначение |
Описание |
Значение |
λsw |
интенсивность отказов коммутатора |
1/516593 ч-1[3] |
λsr |
интенсивность отказа сервера SDN |
1/1700000 ч-1[4] |
λo |
интенсивность обнаружения отказов |
1/0,5–1/24 ч-1 |
μ |
интенсивность восстановления коммутатора |
1/4 ч-1 |
μ 1 |
интенсивность восстановления контроллера SDN при использовании одного сервера |
1/6 ч-1 |
μ 2 |
интенсивность восстановления контроллера SDN из двух серверов |
1/9 ч-1 |
После решения представленных задач с заданными числовыми характеристиками были получены значения коэффициентов готовности при отсутствии и использовании виртуализации, а также построены графики зависимости коэффициентов готовности от интенсивности обнаружения отказов. Для конфигурации сети с использованием виртуализации построены два графика: с увеличенным временем восстановления контроллера и равным времени восстановления контроллера без виртуализации.
Рис. 4. Зависимость коэффициента готовности от среднего времени обнаружения отказа
По полученному графику можно сделать следующие выводы:
- При прочих равных числовых характеристиках, значения коэффициентов готовности при разворачивании контроллера SDN с использованием двух серверов выше, чем при использовании только одного сервера. Кроме того, коэффициент готовности при резервировании менее зависит от времени обнаружения отказа, т. е. с увеличением времени обнаружения отказа значение коэффициента отказа уменьшается медленнее.
- В реальности время восстановления кластера серверов занимает больше времени, отсюда, при малых значения времени обнаружения коэффициент готовности для сети с контроллером SDN, развернутом на одном сервере, больше. Однако, время обнаружения отказа имеет наименьшее влияние на коэффициент готовности сети при резервировании контроллера SDN.
Таким образом, при планировании сети предприятия с использованием контроллера SDN, использование кластера из серверов позволяет получит более надежную сеть даже при значительных временных промежутках до обнаружения отказа при условии отработки механизмов быстрого восстановления кластеров серверов.
Литература:
- Dan Levin, Marco Canini, Stefan Schmid, Anja Feldmann. Incremental SDN Deployment in Enterprise Networks [Электронный ресурс]: Электрон. текстовые дан. — Режимдоступа: https://www.ietf.org/proceedings/89/slides/slides-89-sdnrg-1.pdf, свободный.
- UnderstandingEnterpriseSDN [Электронный ресурс]: Электрон. текстовые дан. — Alliedtelesis, 2015. — Режим доступа: http://www.alliedtelesis.com/userfiles/file/WP_Understanding_Enterprise_SDN_RevA.pdf, свободный.
- D- link. GigabitStackableSmartManagedSwitches [Электронный ресурс]: Электрон. текстовые дан. — D- link, 2015. — Режим доступа: http://www.dlink.com/-/media/Business_Products/DGS/DGS %201510/Datasheet/DGS_1510_Series_Datasheet_EN_EU.pdf, свободный.
- HPPerformanceBriefforExternalAudiences [Электронный ресурс]: Электрон. текстовые дан. — HP, 2007. — Режим доступа: ftp.hp.com/pub/c-products/servers/benchmarks/dl380_spec2005_062707.pdf, свободный.