По всем вопросам звоните:

+7 495 274-22-22

УДК: 530.1

Построение высоконадежных кластерных систем с использованием программного обеспечения виртуализации

Алексанков С.М. Санкт-Петербургский национальный исследовательский университет информационных технологий, механики и оптики, г. Санкт-Петербург, E-mail: alexankov@rambler.ru

Рассмотрены основные требования к высоконадежным кластерным системам на базе технологий виртуализации, существующие механизмы повышения отказоустойчивости и доступности на базе технологий виртуализации, их преимущества и недостатки. Сформулированы проблемы проектирования высоконадежных кластерных систем

Литература:

1. Red Hat Enterprise Linux 5. Обзор Cluster Suite. 2009 // redhat.com. URL: https://access.redhat.com/ documentation/ru-RU/Red_Hat_Enterprise_Linux/5/html/ Cluster_Suite_Overview/index.html (дата обращения: 23.12.2016).

2. Общее представление о конфигурациях кворума в отказоустойчивом кластере // technet.microsoft. com: проект компании Microsoft, предназначенный для технических специалистов по администрированию ПО. URL: https://technet.microsoft.com/ru-ru/library/ cc731739(v=ws.11).aspx (дата обращения: 22.12.2016).

3. Высокая доступность (High availability) // rtcloud. ru: Облачная платформа от национального оператора. 2017. URL: http://rtcloud.ru/technology/clo0ud-server/ vysokaya-dostupnost-high-availability (дата обращения: 22.12.2016).

4. Джон Сэвилл. Что представляет собой кворум отказоустойчивого кластера WindowsServer 2008? 28.07.2008 // osp.ru: журнал Windows IT Pro/RE, №3, 2008. URL: https://www.osp.ru/winitpro/2008/03/5270403/ (дата обращения: 23.12.2016).

5. Рыбников Ю. Понятие кворумов. Что такое кворум в кластеризации. 08.03.2015 // xp-7.ru: Новости windows. URL: http://xp-7.ru/publ/4-1-0-1017(дата обращения: 22.12.2016).

6. Clark C., Fraser K., Hand S., Hansen J. G., Jul E., Limpach C., Pratt I., Warfield A. Live migration of virtual machines // NSDI'05 Proceedings of the 2nd conference on Symposium on Networked Systems Design & Implementation – Vol. 2. – 2005. – P. 273–286.

7. Алексанков С.М. Модель процесса динамической миграции с копированием данных после остановки виртуальных машин // Изв. вузов. Приборостроение. – 2016. – Т. 59. – № 5. – С. 173–178.

8. Технология Kemari // xguru.ru: портал обмена знаниями по UNIX/Linux-системам, системам с открытым исходным кодом, сетям и другим родственным вещам. URL: http://xgu.ru/wiki/Kemari (дата обращения: 04.05.2017).

9. Беляев А. Большой ликбез: распределенные системы хранения данных в практической привязке для администраторов среднего и крупного бизнеса. 2015 // habrahabr.ru: Блог компании КРОК. URL: https:// habrahabr.ru/company/croc/blog/272795/ (дата обращения: 15.01.2017).

10. Жбанков А. Виртуальные сети в VMware vSphere. Standard vSwitch. – Часть 1. 2010 // портал IT Band. URL: http://itband.ru/2010/09/vmware-vswitch1/ (дата обращения: 08.05.2017).

11. Руденко А. Виртуальный распределенный коммутатор. 2013 // samag.ru: журнал Системный администратор. – 2013. – Вып. №10 (131). URL: http://samag.ru/ archive/article/2558/ (дата обращения: 21.01.2017).

12. Sanjay Ghemawat, Howard Gobioff, and Shun-Tak Leung. GoogleThe Google File System // SOSP’03, October 19–22, 2003, Bolton Landing, New York, USA.

13. Chintureena Thingom // International Journal of Interdisciplinary and Multidisciplinary Studies (IJIMS), 2014, Vol. 1, No.4, 82–86.

14. Sahni S., Varma V. A Hybrid Approach to Live Migration of Virtual Machines // Cloud Computing in Emerging Markets (CCEM), 2012. IEEE International Conferenceon, 11–12. Oct. – 2012. – P. 1–5.

• • •

Локальные кластерные системы отличаются высоким уровнем связности, так как могут обеспечить передачу любой необходимой синхронизирующей информации без задержек благодаря малым расстояниям между оборудованием. Одна из основных задач локальных и территориальных кластерных систем – своевременное определение отказов. За это отвечает программное обеспечение (ПО) для кластеризации. ПО кластеризации должно обеспечивать поддержку кворума, то есть согласованного состояния кластера, определяющего количество отказов узлов, которые кластер может иметь или удерживать, сохраняя доступность пользовательских сервисов. Как только порог не отвечающих или сбойных узлов в кворуме превышается, весь кластер должен перейти в отключенный режим. Это связано с тем, что помимо отказов узлов на состояние кластера также могут влиять проблемы работы сети, связывающей серверы. Узлы из одного набора могут связываться друг с другом, используя работающую часть сети, но не могут связываться с другим набором узлов в другой части сети. Задача поддержки кворума заключается в том, чтобы предотвращать аномалию, называемую расщеплением (или сплитом), когда два сервера из разных частей сети в кластере могут попытаться выполнить запись в один и тот же файл, в частности на внешнем общем хранилище, и потенциально повредить данные. В случае расщепления хотя бы один набор узлов должен прекратить свою работу.

Работа кворума, таким образом, связана с недопущением данной проблемы и принятием решения о том, должен ли кластер продолжать функционирование, при этом гарантированно изолировав проблемные узлы до тех пор, пока они не смогут нормально взаимодействовать в составе кластера.

Например, в кластере из пяти узлов произошло расщепление, и узлы 1, 2 и 3 могут взаимодействовать друг с другом, но не с узлами 4 и 5. Тогда узлы 1, 2 и 3 должны образовать большинство и продолжать работать как кластер. Узлы, которые являются меньшинством, должны прекратить работать. По возможности работающая часть должна гарантированно изолировать проблемные узлы 4 и 5 с помощью процедуры, называемой Fencing [1]. Это процесс исключения узлов из работы кластера. Как правило, Fencing сводится к обесточиванию серверов с помощью специальных механизмов. Далее узел 3 теряет связь с другими узлами, все узлы должны прекратить работать в качестве кластера [2–3].

Для Цитирования:
Алексанков С.М., Построение высоконадежных кластерных систем с использованием программного обеспечения виртуализации. КИП и автоматика: обслуживание и ремонт. 2017;11.
Полная версия статьи доступна подписчикам журнала
Язык статьи:
Действия с выбранными: