В настоящее время существует достаточно много прикладных и научных задач, требующих для своего решения больших вычислительных мощностей, предоставляемых суперкомпьютерными технологиями. Высокопроизводительные вычисления используются в самых различных областях, в таких как моделирование погоды, компьютерное управление производственными процессами, анализ фондового рынка, обработка потоков информации в распределенных базах данных, автоматизация проектирования, управление сотовой связью, биоинформатика, биохимия, биофизика, теплофизика, динамика жидкостей и газов, электромагнетизм и др.
В высокопроизводительных системах задействуется все больше ученых, инженеров, любителей. Управление, администрирование и даже простой запуск задач на кластере предполагает достаточно высокие требования к знанию дополнительной массы деталей, по сути чисто технического характера, которые необходимы специалисту в своей области, помимо свойств применяемых пакетов программ и их специфического языка.
Стандартным интерфейсом работы с суперкомпьютером является консоль (командная строка). Консольный интерфейс позволяет максимально использовать возможности операционной системы, но сложен в изучении, требует глубоких знаний команд. Для неподготовленного пользователя суперкомпьютера консоль оказывается барьером в его освоении.
Для просмотра статистики по запущенным задачам, нагрузки системы, результатов вычислений требуется физическое присутствие человека за главным компьютером кластера. Отсутствие средств самодиагностики суперкомпьютера приводит к тому, что ошибки могут жить неделями. Это сильно сказывается на качестве предоставляемых сервисов.
Часто у суперкомпьютера отсутствует средство сбора статистики использования ресурсов и автоматического построения отчетов.
В случае возникновения проблем с высокопроизводительной системой требуется высококвалифицированный специалист, который должен всегда находиться в непосредственной близости с кластером.
Системы удаленного управления кластером позволяют решать вышеописанные проблемы. В данной статье сравним следующие системы удаленного управления кластером, представленные на рисунке 1.
Рисунок 1 –Классификация удаленного управления
Выделим следующие критерии сравнения:
Независимость от операционной системы. Управление и доступ к компьютеру при выключенной системе.
Внешние коммуникационные соединения. Признак описывает интерфейсы решения, через которые можно действовать извне. Коммуникации могут осуществляться по внешнему (Out of Band, OoB) и основному (In Band, IB) каналам.
Доступ к коду загрузки/BIOS. В качестве кода загрузки компьютера обычно обозначают ту часть программного обеспечения энергонезависимой памяти, выполнение которой происходит непосредственно после включения системы. С его помощью задаются основные параметры системы и осуществляется управление самим процессом загрузки. Если код загрузки рабочей станции с сокращенным набором команд (RISC) обращается чаще всего к последовательной консоли, то код загрузки компьютера (традиционно обозначаемый как BIOS) предполагает наличие соответствующей графической карты VGA.
Безопасность. Цель удаленного управления заключается в обеспечении глобального доступа к устройству, что означает доступность высокопроизводительной системы для всего мира. Таким образом, ясно, что концепция безопасности решения удаленного управления должна быть тщательно продумана и отработана. Шифрование, подтверждение подлинности и контроль доступа — традиционно применяемые для этого технологии.
Внутреннее соединение. Критерий определяет, через какие интерфейсы администратор осуществляет удаленное управление контролируемым компьютером. Помимо типичных аппаратных интерфейсов, таких, как выход VGA или кнопка сброса, распространены и программные интерфейсы.
Виртуальные устройства. Они дают возможность системе управления эмулировать на компьютере оборудование, которое в действительности к нему не подсоединено. Чаще всего виртуальные устройства используются для того, чтобы загрузить компьютер с альтернативного образа диска, передача которого осуществляется через управляющее соединение.
Программное обеспечение управления. Наибольшее распространение получили две концепции: система управления может использовать нестандартный или стандартный протокол. В первом случае требуется применение специального программного обеспечения. Во втором — можно применять любое соответствующее стандарту программное обеспечение. Промежуточное положение занимает выбор в качестве коммуникационного протокола НТТР или telnet. Эти протоколы стандартизированы, следовательно, вполне подойдет стандартное ПО, например браузер Web. Правда, они не поддерживают определение и обмен метаинформацией, каковая описывает функциональность решений. Это значит, что собственные интерфейсы пользователей, в свою очередь, нестандартны.
Распространение. Распространенность решения определяется тем, насколько оно значимо практически или как проверено на практике.
В группе оборудование имеется удлинитель интерфейса. Под этим понимается дополнительное аппаратное обеспечение, позволяющее удлинение существующего интерфейса, поэтому его рассматривать в сравнении не будем.
Для устройств, к которым не применимы вышеописанные критерии сравнения, не будет указан критерий. Сравнительные характеристики приведены в таблице 1.
Таблица 1 – Сравнительные характеристики
|
Класс |
Независимость от операционной системы. |
Внешние коммуникационные соединения |
Доступ к коду загрузки/BIOS |
Безопасность |
Внутреннее соединение |
Виртуальные устройства |
Программное обеспечение управления |
Распространение |
Платы дистанционного управления |
Доступ /оборудование /провайдер |
да |
Ethernet, модем (ISDN) |
да |
SSL и авторизация |
Питание, сброс, напряжение, VGA, клавиатура, мышь, IPMI |
да |
На базе Web или нестандартное |
На серверах и зависимы от изготовителя |
Последовательные консоли |
Доступ /оборудование/адаптер |
да |
Ethernet, модем (ISDN) |
да |
SSL |
RS232 |
нет |
telnet, ssh |
вычислительные центры с компьютерами UNIX |
Устройства управления клавиатурой, монитором и мышью (Keyboard, Video, Mouse, KVM) |
Доступ /ПО/сервер |
нет |
Все интерфейсы хоста |
нет |
SSL |
клавиатура, монитор, мышь |
возможны, но не загрузка |
Любое стандартное идущее в комплекте с ОС, нестандартное |
Широкое применение для управления и удаленной поддержки |
Программное обеспечение удаленного доступа |
протокол |
- |
- |
- |
аутентификация/ шифрование |
- |
- |
Любое клиентское ПО с поддержкой SNMP |
Широко распространен в сетевом оборудовании |
Простой протокол управления сетью (Simple Network Management Protocol, SNMP) |
протокол |
- |
- |
- |
аутентификация/ шифрование |
- |
- |
Любое клиентское ПО с поддержкой SNMP |
Широко распространен в сетевом оборудовании |
Управление на базе Web (Web Based Enterprise Management, WBEM) |
протокол |
- |
- |
- |
HTTPS/SSL |
- |
- |
Браузер Web, нестандартное |
Мало распространены |
- В таблице были рассмотрены изолированно друг от друга различные системы. Однако зачастую лишь умелая комбинация технологий приводит к желаемой программе управления. Типичным примером является подключение устройства для работы с клавиатурой, монитором и мышью по IP к компьютеру, у которого одновременно должны быть в распоряжении и другие параметры платы, в частности сброс и питание. Подключение реализуется очень просто при помощи IPMI, естественно, если компьютер и работающее через IP устройство KVM его поддерживают.
- Наиболее дороги из всех обсуждаемых технологий дистанционного управления работающие по IP устройства KVM. Расходы можно снизить путем их комбинирования с традиционными переключателями KVM, у которых есть все необходимое для переключения подсоединенного компьютера на аналоговый путь.
- В таблице были рассмотрены изолированно друг от друга различные системы. Однако зачастую лишь умелая комбинация технологий приводит к желаемой программе управления. Типичным примером является подключение устройства для работы с клавиатурой, монитором и мышью по IP к компьютеру, у которого одновременно должны быть в распоряжении и другие параметры платы, в частности сброс и питание. Подключение реализуется очень просто при помощи IPMI, естественно, если компьютер и работающее через IP устройство KVM его поддерживают.
Однако важный вопрос остается без ответа: «Как со всеми этими возможностями, которые дает мне в руки удаленное управление, решить мою собственную проблему? К примеру, что делать, если не загружается мой управляющий компьютер?» Ноу-хау администраторов имеет решающее значение для беспрепятственной эксплуатации оборудования, а удаленное управление между тем позволит значительно снизить затраты и сократить время на решение определенных задач.
Литература:
Baker M. et al. Cluster Computing White Paper. Final Release, Version 2.0.
Описание виртуальных сетевых вычислений (http://www.uk.research.att.com/vnc)
Ройзензон Г.В. СППР для выбора вычислительных кластеров // Труды международных научно-технических конференций «Интеллектуальные системы» (IEEE AIS’03) и «Интеллектуальные САПР» (CAD-2003). Т. 1. М.: Физмат-лит, 2003. С. 443–448.
Андреев А.Е., Попов Д.С., Жариков Д.Н. Building of high-performance cluster system based on existing pool of computers using GNU/ Linux operating system. Известия ВолгГТУ, №6(54), 2009. С. 48-51.
Рабочая группа по распределенному управлению DMTF (http://www.dmtf.org/standards/)