The OpenNET Project: Отказоустойчивый кластер на базе OpenVZ, DRBD и Heartbeat 2

Отказоустойчивый кластер на базе OpenVZ, DRBD и Heartbeat 2	[исправить]
Постановка задачи и общее описание решения Совместное применение технологий Linux Heartbeat, DRBD и OpenVZ позволяет создавать удобные в эксплуатации решения, обеспечивающие повышенную надёжность функционирования важных для пользователей сервисов. Несмотря на доступность большого количества материалов по технологиям построения отказоустойчивых решений на базе ОС Linux, автору данной статьи не удалось отыскать полного и исчерпывающего описания процесса создания системы, основанной на сочетании использования перечисленных выше технологий. Данная статья описывает результаты практической апробации отказоустойчивого решения, осуществляющего автоматическую миграцию виртуальных окружений OpenVZ на резервный узел кластера при нарушении функционирования основного узла. Рассматриваем пример развёртывания приложения, использующего базу данных (PostgreSQL) и развёртываемого на базе сервера приложений (Tomcat). В качестве базовой операционной системы используем Debian GNU/Linux 5.0 (Lenny). Предполагаем, что приложение не поддерживает кластерный режим работы (не может функционировать одновременно на нескольких узлах). Для обеспечения отказоустойчивого функционирования используем два идентичных сервера, на одном из которых в нормальном режиме функционируют необходимые базы данных, на другом - сервер приложений. Взаимодействие между базами данных и приложениями осуществляется через сеть TCP/IP. Для установки сервера СУБД и сервера приложений создаем отдельные виртуальные OpenVZ-окружения. Конфигурация виртуальных окружений и физических серверов подбирается таким образом, чтобы на одном физическом сервере при необходимости могли одновременно функционировать как сервер СУБД, так и сервер приложений (возможно, со сниженной производительностью). Для обеспечения функционирования OpenVZ при использовании 32-битной версии Debian GNU/Linux физические сервера должны поддерживать технологию PAE (Physical Address Extension). Если вместо физических серверов используются виртуальные машины VirtualBox, требуется включить соответствующий режим в настройках виртуальной машины. Для синхронизации данных, хранящихся на физических серверах, используем DRBD в режиме master-slave. На физических серверах создаем два DRBD-раздела (один для сервера приложений, другой для сервера СУБД), причём в нормальном режиме функционирования на каждом из серверов в режиме master находится только один из DRBD-разделов. Для контроля доступности серверов кластера и переключения на резервный узел при отказе основного узла используем Heartbeat. Создаваемый в результате кластер обеспечивает автоматическую миграцию ресурсов с вышедшего из строя узла кластера на оставшийся работоспособным узел. Поскольку ни используемая СУБД, ни приложения не поддерживают кластерный режим работы, неизбежно возникает приостановка предоставления сервисов на период миграции ресурсов с остановленного узла кластера на работающий. Продолжительность периода приостановки сервисов зависит от времени запуска мигрируемых сервисов после сбоя, из практических соображений в нашем примере получается, что этот период будет менее 1 минуты. Необходимые первоначальные знания и навыки 1.Работа с инсталлятором системы Debian/GNU Linux 5.0, в частности, с модулем разметки дисков. Умение установить и настроить базовую систему. 2.Установка и удаление пакетов Debian с использованием программы aptitude. Настройка исходных репозиториев для установки и обновления программ (/etc/apt/sources). 3.Понимание принципов работы LVM, навыки настройки и применения LVM (http://tldp.org/HOWTO/LVM-HOWTO/). 4.Понимание принципов работы OpenVZ (http://www.openvz.org/). Навыки настройки окружений OpenVZ и работы с ними. 5.Общее понимание принципов организации отказоустойчивых кластеров (контроль доступности, синхронизация данных, миграция ресурсов, потеря синхронизации - "brain split"). 6.Понимание принципов работы DRBD 8 (http://www.drbd.org/). 7.Понимание принципов работы Heartbeat 2 (http://linux-ha.org/wiki/Heartbeat). Установка базовой системы Для установки базовой системы может использоваться дистрибутивный комплект Debian GNU/Linux 5.0. При установке для удобства дальнейшей работы выполним русификацию системы, а вот от установки группы пакетов "Стандартная система" откажемся - большая часть пакетов из этой группы нам не понадобится. Установку системы на обоих узлах выполняем идентичным образом, различаются только имя узла и сетевые настройки. В данном примере использовались параметры, приведённые в таблице. Параметр Узел 1 Узел 2 Имя узла deimos phobos IP-адрес 192.168.5.101 192.168.5.102 Для разметки дисков используем комбинацию обычных разделов и LVM. Для корневой файловой системы (совмещённой с файловой системой /boot) создаем обычный раздел №1 размером 4 Гбайт (этого более, чем достаточно для размещения необходимых компонентов), всё остальное пространство выделяем в раздел 2 и создаем на нем физический том LVM. Здесь предполагается, что к серверам подключено по одному диску (тому дискового массива), в случае наличия нескольких устройств следует особым образом спланировать порядок их использования. На основе созданного физического тома LVM создаем группу логических томов, в которой создаем том подкачки (размер зависит от размера оперативной памяти) и том для файловой системы /var (объёмом 2 Гбайт). Для корневой файловой системы и файловой системы /var используем файловую систему ext3, так как на нее меньше всего нареканий по части восстановления в аварийных ситуациях. После завершения установки необходимо убедиться в наличии связи между узлами кластера с помощью команды ping. Для обеспечения доступа к узлам кластера по именам рекомендуется прописать соответствие адресов именам в файле /etc/hosts. Установка дополнительных пакетов Вместо установленной по умолчанию версии ядра необходимо установить ядро с поддержкой OpenVZ: aptitude install linux-image-2.6-openvz-686 aptitude remove linux-image-2.6-686 Также необходимо установить модули DRBD8 и соответствующие управляющие программы: aptitude install drbd8-modules-2.6-openvz-686 drbd8-utils Установка Heartbeat 2: aptitude install heartbeat-2 Для удобства работы устанавливаем mc, less, atop и ssh: aptitude install mc atop ssh Настройка DRBD На каждом узле будущего кластера необходимо создать по два тома: один для базы данных, другой - для сервера приложений. Размер томов следует выбирать исходя из планируемых потребностей базы данных и сервера приложений. В дальнейшем при необходимости можно будет расширить соответствующие тома. Поскольку заранее точно предсказать требуемое пространство (и его соотношение между потребителями) достаточно сложно, предпочтительно оставить в группе томов LVM достаточный объём свободного пространства, а виртуальным окружениям выделить тот объём, который будет необходим в ближайшее время. Пример команд создания томов LVM: lvcreate -L 8G -n db VGroup00 lvcreate -L 4G -n apps VGroup00 Далее необходимо создать конфигурационный файл /etc/drbd.conf, определяющий состав дисковых ресурсов DRBD. Пример конфигурационного файла drbd.conf: global { usage-count no; } common { handlers { pri-on-incon-degr "echo o > /proc/sysrq-trigger ; halt -f"; pri-lost-after-sb "echo o > /proc/sysrq-trigger ; halt -f"; local-io-error "echo o > /proc/sysrq-trigger ; halt -f"; outdate-peer "/usr/lib/heartbeat/drbd-peer-outdater -t 5"; # pri-lost "echo pri-lost. Have a look at the log files. \| mail -s 'DRBD Alert' root"; # split-brain "echo split-brain. drbdadm -- --discard-my-data connect $DRBD_RESOURCE ? \| mail -s 'DRBD Alert' root"; } startup { # wfc-timeout 0; degr-wfc-timeout 120; # 2 minutes. # wait-after-sb; } disk { on-io-error detach; no-disk-flushes; no-md-flushes; } syncer { rate 30M; al-extents 257; } net { sndbuf-size 512k; timeout 60; # 6 seconds (unit = 0.1 seconds) connect-int 10; # 10 seconds (unit = 1 second) ping-int 10; # 10 seconds (unit = 1 second) ping-timeout 5; # 500 ms (unit = 0.1 seconds) max-buffers 2048; cram-hmac-alg "sha1"; shared-secret "DJujhjltepbyfFDRbtddtLzlmrf"; after-sb-0pri discard-younger-primary; after-sb-1pri consensus; after-sb-2pri disconnect; rr-conflict disconnect; } } resource db { protocol C; on deimos { device /dev/drbd0; disk /dev/VGroup00/db; address 192.168.5.101:7788; flexible-meta-disk internal; } on phobos { device /dev/drbd0; disk /dev/VGroup00/db; address 192.168.5.102:7788; flexible-meta-disk internal; } } resource apps { protocol C; on deimos { device /dev/drbd1; disk /dev/VGroup00/apps; address 192.168.5.101:7789; flexible-meta-disk internal; } on phobos { device /dev/drbd1; disk /dev/VGroup00/apps; address 192.168.5.102:7789; flexible-meta-disk internal; } } В приведённом примере: Параметры в секции common наследуются всеми ресурсными секциями. При необходимости для конкретных ресурсов эти параметры можно переопределить. Настройками определено два DRBD-устройства: /dev/drbd0 и /dev/drbd1, для каждого из которых используются два хранилища: на узле phobos и на узле deimos. Параметр syncer.rate требуется установить исходя из пропускной способности сетевого интерфейса между узлами. Параметр задается в единицах байт/сек, суффикс M означает умножение на 1 млн. Параметр common.net.shared-secret требуется установить в значение пароля, используемого для аутентификации взаимодействия между узлами. Сетевые адреса узлов и номера портов необходимо установить в соответствии с сетевой конфигурацией, соответствующие параметры: resource(db).on(deimos).address resource(db).on(phobos).address resource(apps).on(deimos).address resource(apps).on(phobos).address Подготовленный конфигурационный файл /etc/drbd.conf должен быть одинаков на обоих узлах. Передать файл с узла phobos на узел deimos можно командой: scp /etc/drbd.conf deimos:/etc/drbd.conf Необходимо убедиться, что DRBD запущен. Для этого используется команда /etc/init.d/drbd status. Если DRBD остановлен, требуется выполнить команду /etc/init.d/drbd start. После создания и синхронизации конфигурационного файла необходимо выполнить инициализацию томов DRBD выполнением (на каждом узле) следующих команд: drbdadm create-md db drbdadm create-md apps После завершения томов необходимо форсировать синхронизацию томов между узлами. Для этого следует выбрать (произвольным образом) один из узлов в качестве основного, и выполнить на нем команды: drbdsetup /dev/drbd0 primary -o drbdsetup /dev/drbd1 primary -o Ход синхронизации можно контролировать по содержимому файла /proc/drbd. После завершения синхронизации рекомендуется перезагрузить оба узла и проконтролировать, что запуск DRBD был выполнен автоматически и что состояние томов является синхронным, путём выполнения (после перезагрузки) команды /etc/init.d/drbd status. Создание виртуальных окружений Перед созданием виртуальных окружений необходимо принять решение, на каком из физических серверов какое из двух виртуальных окружений должно функционировать в нормальном режиме. Предположим, что сервер баз данных (db) будет функционировать на физическом сервере deimos, а сервер приложений (apps) - на физическом сервере phobos. Действия по настройке каждого из виртуальных окружений будем выполнять на том физическом сервере, на котором данное окружение будет в дальнейшем преимущественно функционировать. Затем скопируем необходимые настройки на второй сервер. Первым шагом в создании виртуальных окружений является создание файловых систем, в которых будут размещаться данные этих виртуальных окружений: 1.Создаются каталоги для монтирования файловых систем виртуальных окружений 2.Соответствующей DRBD-устройство переводится в режим "primary" 3.Создается файловая система ext3 на DRBD-устройстве 4.Отключаются автоматические проверки целостности файловой системы при монтировании 5.Выполняется монтирование созданной файловой системы На сервере deimos выполняем команды: mkdir /Data mkdir /Data/db mkdir /Data/apps drbdadm primary db mkfs -t ext3 /dev/drbd0 tune2fs -c 0 -i 0 /dev/drbd0 mount /dev/drbd0 /Data/db На сервере phobos выполняем команды: mkdir /Data mkdir /Data/db mkdir /Data/apps drbdadm primary apps mkfs -t ext3 /dev/drbd1 tune2fs -c 0 -i 0 /dev/drbd1 mount /dev/drbd1 /Data/apps Создание виртуальных окружений необходимо выполнять на основе шаблона. Такой шаблон можно подготовить самостоятельно в соответствии с инструкцией (http://wiki.openvz.org/Debian_template_creation), либо использовать готовый. Для создания виртуальных окружений используются команды: На сервере deimos vzctl create 101 --ostemplate debian-5.0-i386-my --ipadd \ 192.168.5.103 --hostname db --private /Data/db/vm На сервере phobos vzctl create 102 --ostemplate debian-5.0-i386-my --ipadd \ 192.168.5.104 --hostname apps --private /Data/apps/vm Необходимо учесть следующие особенности: 1.Виртуальным окружениям необходимо присвоить разные идентификаторы (в нашем примере - 101 и 102), иначе их нельзя будет запустить на одном сервере. 2.IP-адреса и имена хостов виртуальных окружений должны соответствовать используемой сетевой конфигурации. 3.В параметре ostemplate нужно указать имя используемого шаблона виртуальных окружений. 4.Подкаталог 'vm' томов виртуальных окружений не должен существовать на момент выполнения команды vzctl create, иначе команда завершится с ошибкой. После создания виртуальных окружений необходимо установить для них ресурсные ограничения и проверить формальную корректность выполненных настроек. Величина ресурсных ограничений зависит от доступных аппаратных ресурсов серверов и от потребностей запускаемых приложений. В нашем примере используются следующие команды настройки: На сервере deimos vzctl set 101 --numproc 300:300 --kmemsize 32m:40m \ --vmguarpages 512m:unlimited --privvmpages 512m:512m \ --oomguarpages 256m:unlimited --shmpages 256m:256m \ --tcpsndbuf 1m:2m --tcprcvbuf 1m:2m --save На сервере phobos vzctl set 102 --numproc 300:300 --kmemsize 32m:40m \ --vmguarpages 512m:unlimited --privvmpages 512m:512m \ --oomguarpages 256m:unlimited --shmpages 256m:256m \ --tcpsndbuf 1m:2m --tcprcvbuf 1m:2m --save В приведённом примере разрешено запускать до 300 потоков выполнения (параметры numproc и kmemsize), использующих до 512 Мбайт виртуальной памяти (параметры vmguardpages, privvmpages), с гарантией отсутствия вытеснения при нехватке памяти до 256 Мбайт (параметр oomguarpages), и с допустимым использованием разделяемой памяти System V до 256 Мбайт (параметр shmpages). Также установлен увеличенный размер буферов протокола TCP. Для проверки корректности полученной конфигурации используется программа vzcfgvalidate: На сервере deimos vzcfgvalidate /etc/vz/conf/101.conf На сервере phobos vzcfgvalidate /etc/vz/conf/102.conf Необходимо отключить автоматический запуск виртуальных окружений при старте сервера, так как запуск и остановка должны выполняться под управлением системы Heartbeat. На сервере deimos vzctl set 101 --onboot no --save На сервере phobos vzctl set 102 --onboot no --save Для запуска и остановки виртуальных окружений вручную используются команды: На сервере deimos vzctl start 101 # Запуск vzctl stop 101 # Остановка На сервере phobos vzctl start 102 # Запуск vzctl stop 102 # Остановка ВНИМАНИЕ! Запуск и остановка виртуальных окружений вручную, как и другие операции ручного манипулирования состоянием управляемых Heartbeat ресурсов (включая тома DRBD и созданные на них файловые системы) допускается только тогда, когда службы Heartbeat остановлены на обоих узлах кластера. Или - в нашем текущем примере - ещё не настроены вовсе. После первоначального запуска созданных виртуальных окружений можно выполнить установку в эти виртуальные окружения прикладного программного обеспечения, а можно и отложить действия по установке до завершения настройки кластера. В нашем примере можно установить сервер СУБД в виртуальное окружение db и сервер приложений в виртуальное окружение apps: На сервере deimos выполняем команды: vzctl enter 101 aptitude install postgresql exit На сервере phobos выполняем команды: vzctl enter 102 cd /root mkdir DISTRIB cd DISTRIB scp files.sample.com:/distrib/jdk-6u22-linux-i586.bin . scp files.sample.com:/distrib/apache-tomcat-6.0.29.tar.gz . cd /opt sh /root/DISTRIB/jdk-6u22-linux-i586.bin tar xfz /root/DISTRIB/apache-tomcat-6.0.29.tar.gz exit Описание полного состава действий по настройке СУБД, сервера приложений и самих приложений выходит за рамки данной статьи. Конфигурационные файлы виртуальных окружений необходимо сохранить на обоих узлах кластера. Для этого на узле phobos выполним следующие команды: scp deimos:/etc/vz/conf/101.conf /etc/vz/conf/ scp /etc/vz/conf/102.conf deimos:/etc/vz/conf/ Настройка Heartbeat В рамках подготовки к настройке Heartbeat необходимо активировать модуль ядра softdog, обеспечивающий автоматическую перезагрузку физического сервера при длительном отсутствии активности со стороны системы Heartbeat. Для этого на обоих узлах кластера (phobos и deimos) выполняются следующие команды: modprobe softdog nowayout=0 echo "softdog nowayout=0" >>/etc/modules.conf Настройка Heartbeat заключается в создании трёх конфигурационных файлов: /etc/ha.d/ha.cf - файл основной конфигурации Heartbeat /etc/ha.d/authkeys - файл аутентификации узлов /etc/ha.d/haresources - файл описания ресурсов кластера Файлы authkeys и haresources должны быть одинаковы на обоих узлах кластера. Файлы ha.cf также должны совпадать с точностью до параметров метода контроля состояния соседнего узла кластера (в нашем примере используется метод ucast, для которого обязательно указать IP другого узла кластера - при использовании других методов файлы ha.cf на обоих узлах кластера обычно совпадают). Пример содержимого файла authkeys: auth 1 1 sha1 4ffb8d2d786ba67772045b2eeac899ed Команда для генерации ключа, помещаемого в файл файла authkeys: (dd if=/dev/urandom bs=1024 count=1 2>/dev/null) \| md5sum Пример файла haresources, настроенного для нашего случая: deimos drbddisk::db Filesystem::/dev/drbd0::/Data/db openvz::101 phobos drbddisk::apps Filesystem::/dev/drbd1::/Data/apps openvz::102 Здесь предполагается наличие в каталоге /etc/ha.d/resource.d следующих скриптов: drdbdisk - управление DRBD Filesystem - обеспечение монтирования файловой системы openvz - управление виртуальными окружениями OpenVZ Скрипты drdbdisk и Filesystem поставляются в составе пакета heartbeat-2 ОС Debian GNU/Linux 5.0. Скрипт openvz приводим здесь: #!/bin/bash # # This script is inteded to be used as resource script by heartbeat # ### VZCTL="/usr/sbin/vzctl" if [ "$#" -eq 2 ]; then RES="$1" CMD="$2" else RES="101" CMD="$1" fi case "$CMD" in start) $VZCTL start $RES ;; stop) $VZCTL stop $RES ex=$? case $ex in 0) exit 0 ;; ) exit 1 ;; esac ;; status) ST=$( $VZCTL status $RES 2>&1 ) STATE=$( echo "$ST" \| (read s1 s2 s3 s4 st && echo $st) ) case $STATE in running) echo "running" exit 0 # LSB status "service is OK" ;; down) echo "stopped" ;; ) echo "stopped ($ST)" ;; esac exit 3 # LSB status "service is not running" ;; ) echo "Usage: openvz resource {start\|stop\|status}" exit 1 ;; esac exit 0 Примеры файлов ha.cf на серверах phobos и deimos: На сервере deimos: keepalive 1 deadtime 15 warntime 5 initdead 120 ucast eth0 192.168.5.102 auto_failback on watchdog /dev/watchdog node deimos node phobos На сервере phobos: keepalive 1 deadtime 15 warntime 5 initdead 120 ucast eth0 192.168.5.101 auto_failback on watchdog /dev/watchdog node deimos node phobos Дополнительные настройки Heartbeat* Крайне желательно в промышленной конфигурации настроить отдельный канал контроля состояния серверов (например, на основе соединения через COM-порты). Для реализации такой схемы потребуется изменение настроек в файле ha.cf. Также крайне желательно обеспечить функционирование STONITH-устройства. Как минимум должно быть настроено аварийное завершение работы узлов кластера путём входа через SSH (STONITH-модуль external/ssh), идеальным же вариантом является подача команды в систему управления электропитанием либо в отдельный блок управления состоянием сервера (iLo, ...). Тестирование кластера Для тестирования необходимо сымитировать стандартные ситуации: 1.Выключение узла deimos 2.Включение узла deimos через некоторое время 3.Выключение узла phobos 4.Включение узла phobos через некоторое время 5.Одновременная загрузка узлов кластера 6.Загрузка узлов кластера с задержкой относительно друг друга В случае реализации описанных выше дополнительных настроек Heartbeat также полезно выполнить дополнительные тесты: 1. Нарушение сетевого взаимодействия между узлами кластера (возможно - при сохранении доступа к ним из внешних сетей) Обслуживание: расширение DRBD-дисков Для расширения доступного виртуальным окружениям дискового пространства в группе томов LVM, в которой были созданы тома DRBD, должно быть достаточное свободное пространство. Подключение дополнительных дисков В случае отсутствия достаточного свободного пространства можно расширить группу томов путём включения в неё дополнительных физических томов. Для этого необходимо, чтобы к используемым серверам были подключены необходимые дисковые устройства. В большом числе случаев для подключения дополнительных дисков будет необходимо выполнить остановку соответствующего сервера, в нашем случае эту операцию можно выполнить без длительного перерыва в предоставлении сервисов пользователям, за счёт использования возможностей кластера. Пример сценария добавления дисков: 1.Остановить (выключить) сервер deimos. Все сервисы мигрируют на сервер phobos. 2.Добавить дополнительные диски в сервер deimos, выполнить необходимые настройки BIOS и контроллеров для обеспечения доступа к дискам. 3.Включить сервер deimos. Дождаться синхронизации томов DRBD (контроль по содержимому файла /proc/drbd) и завершения обратной миграции части сервисов обратно на сервер deimos. 4.Остановить (выключить) сервер phobos. Все сервисы мигрируют на сервер deimos. 5.Добавить дополнительные диски в сервер phobos. 6.Включить сервер phobos. При выполнении работ по подключению дисков по описанному выше сценарию в нашем случае будет два перерыва в предоставлении сервисов пользователям, каждый из перерывов в пределах 1 минуты. Подключенные дополнительные диски необходимо разметить и разместить на них физические тома LVM. Для разметки дисков используем программу GNU Parted, если она не установлена - устанавливаем её командой aptitude install parted. Пример команд для выполнения разметки диска: deimos:~# parted /dev/sdc GNU Parted 1.8.8 Using /dev/sdc Welcome to GNU Parted! Type 'help' to view a list of commands. (parted) print Error: /dev/sdc: unrecognised disk label (parted) mklabel New disk label type? msdos (parted) mkpart primary 1s -1s (parted) set 1 lvm on (parted) print Model: ATA VBOX HARDDISK (scsi) Disk /dev/sdc: 2147MB Sector size (logical/physical): 512B/512B Partition Table: msdos Number Start End Size Type File system Flags 1 512B 2147MB 2147MB primary lvm (parted) quit Information: You may need to update /etc/fstab. deimos:~# Для создания физического тома LVM и включения его в необходимую группу томов используем команды: pvcreate /dev/sdc vgextend Data /dev/sdc Расширение файловых систем виртуальных окружений Для расширения файловой системы конкретного виртуального окружения следует последовательно выполнить три операции: 1.Увеличить размер тома LVM 2.Расширить том DRBD 3.Расширить файловую систему Все три операции могут быть выполнены без приостановки сервисов кластера, однако должны выполняться строго при наличии в составе кластера двух работоспособных узлов. Увеличение размера тома LVM выполняется на обоих узлах кластера командой lvextend. Пример увеличения размера тома LVM виртуального окружения db на 1 Гбайт: На сервере phobos lvextend -L+1G /dev/VGroup00/db На сервере deimos lvextend -L+1G /dev/VGroup00/db Операция расширения тома DRBD выполняется синхронно на обоих узлах кластера, и должна инициироваться выполнением команды drbdadm resize. Данная команда должна быть выполнена на узле кластера, являющемся основным (primary) для соответствующего тома. Пример выполнения команды (в нашем случае - на сервере deimos): drbdadm resize db Выполнение данной команды приведёт к началу синхронизации между узлами добавленного пространства логического тома, прогресс синхронизации можно отследить по содержимому файла /proc/drbd. Расширение файловой системы производится путём выполнения команды resize2fs. Данная команда также должна быть выполнена на узле кластера, являющемся основным (primary) для соответствующего тома, и может выполняться без размонтирования файловой системы. Пример выполнения команды (в нашем случае - на сервере deimos): resize2fs /dev/drbd0


11.01.2011 , Автор: Максим Зиналь Ключи: drbd, virtual, openvz, cluster, heartbeat, linux / Лицензия: CC-BY
Раздел: Корень / Администратору / Система / Кластерные технологии

Обсуждение

[ Линейный режим | Показать все | RSS ]

1.1, pachanga (?), 00:19, 12/01/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Спасибо, очень дельная статья

1.2, К.О. (?), 07:31, 12/01/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Спасибо. Тестировалась ли система "в бою", особенно при форсированном завершении обеих нод и рестарте в рандомном порядке (потеря питания, типовой случай)?

2.7, DeadMustdie (??), 00:07, 15/01/2011 [^] [^^] [^^^] [ответить]	+/–
> Тестировалась ли система "в бою", особенно при форсированном завершении обеих > нод и рестарте в рандомном порядке (потеря питания, типовой случай)? Проверяли. Одновременный крах обоих узлов особых проблем не создает, все стартует нормально. Гораздо более неприятная ситуация - потеря связи между узлами при сохранении связи с интернетом и сохранении работоспособности обоих узлов. Для такого случая совершенно необходим работоспособный STONITH, иначе brain split гарантирован.

1.3, Аноним (3), 18:51, 12/01/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Названия серверов кабе символизируют :))

1.4, Hubbitus (ok), 21:35, 12/01/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Спасибо, статья очень дельная и подробная.

1.5, трава (?), 02:02, 13/01/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Чет мне это напоминает.... http://wiki.openvz.org/HA_cluster_with_DRBD_and_Heartbeat

2.8, DeadMustdie (??), 00:09, 15/01/2011 [^] [^^] [^^^] [ответить]	+/–
> Чет мне это напоминает.... > http://wiki.openvz.org/HA_cluster_with_DRBD_and_Heartbeat Как информацию к размышлению я этот текст использовал - среди прочих. Он, к сожалению, сильно устарел и здорово привязан к RedHat - а я старый Debian'щик.

1.6, Сергей (??), 10:17, 13/01/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Спасибо. Хорошая статья.

1.9, deadless (?), 12:27, 15/01/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
а сохраняется ли состояние при отключении одного из узлов кластера? Я имею ввиду синхронизацию памяти, вместе с данными на винте. Происходит ли сохранение пользовательских сессий при миграции сервера tomcat с одного узла на другой?

2.10, DeadMustdie1 (ok), 18:07, 15/01/2011 [^] [^^] [^^^] [ответить]

+/–

> а сохраняется ли состояние при отключении одного из узлов кластера? Я имею
> ввиду синхронизацию памяти, вместе с данными на винте. Происходит ли сохранение
> пользовательских сессий при миграции сервера tomcat с одного узла на другой?

Состояние оперативной памяти при отказе одного из узлов теряется. Вручную выполнить
миграцию с одного узла на другой без потери состояния можно, как это делается -
описано здесь: http://wiki.openvz.org/HA_cluster_with_DRBD_and_Heartbeat

Обеспечить сохранение сессий можно только на уровне сервера приложений, путём сохранения
сессионной информации в базе данных.

Tomcat имеет собственную поддержку работы в кластерном режиме, но для использования данной
возможности приложения, развернутые в нем, должны быть правильно написаны. Приложение,
которое было установлено в кластер нами, в полноценном кластерном режиме работать не
может без выполнения очень сильной модификации его кода - так что пришлось обойдись
"теплым" резервированием.

3.11, deadless (?), 21:24, 15/01/2011 [^] [^^] [^^^] [ответить]	+/–
Понятно, спасибо за ответ. А не рассматривали внедрения проприетарных продуктов, того же vmware к примеру?

4.12, DeadMustdie1 (ok), 22:00, 15/01/2011 [^] [^^] [^^^] [ответить]

+/–

> Понятно, спасибо за ответ. А не рассматривали внедрения проприетарных продуктов, того же
> vmware к примеру?

Не было такой опции. Требовалось обеспечить разумный уровень устойчивости к отказам
без существенных затрат.

Если бы речь шла о серьёзном бюджете, скорее рассматривали бы переход на WebSphere
Network Deployment в кластерном режиме, с соответствующей доработкой приложения.
Такая конфигурация понятнее и надежнее, чем любой чисто системный кластер.

1.16, rav (??), 10:26, 19/05/2011 [ответить] [﹢﹢﹢] [ · · · ]	+/–
Только swap на LVM лучше не делать, про это уже много писали

2.17, DeadMustdie1 (ok), 22:04, 20/05/2011 [^] [^^] [^^^] [ответить]	+/–
> Только swap на LVM лучше не делать, про это уже много писали Когда начинает от души свопить, обычно уже не важно - на LVM своп или на обычном разделе. Масштаб беды от этого слабо меняется.

2.18, Hubbitus (ok), 21:12, 29/05/2011 [^] [^^] [^^^] [ответить]	+/–
> Только swap на LVM лучше не делать, про это уже много писали А почему?

3.19, rav (??), 11:44, 30/05/2011 [^] [^^] [^^^] [ответить]	+/–
>> Только swap на LVM лучше не делать, про это уже много писали > А почему? Ну вот тут http://www.linux.org.ru/forum/general/4946040#comment-4946171, например, написано. Кратко: LVM оперирует экстентами (по 4Мб по умолчанию) использует дисковый буфер и процессор. Когда в системе начинает активно использоваться swap, дисковый кэш минимизируется, да и проц дополнительно нагружается выгрузкой-загрузкой страниц. А тут еще свои 3 копейки добавляет LVM... Если swap используется только "на всякий случай" и для гибернации, тогда неважно, на чем он, но когда может реально нагружаться, лучше на физическом разделе

игнорирование участников | лог модерирования

Добавить комментарий