The OpenNET Project / Index page

[ новости/++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Раздел полезных советов: Создание отказоустойчивого хранилищ..."
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Раздел полезных советов: Создание отказоустойчивого хранилищ..."  +/
Сообщение от auto_tips on 28-Дек-12, 11:35 
Начиная с FreeBSD 8.1 в состав включена поддержка системы репликации устройств хранения данных HAST (Highly Avalable STorage), позволяющей создавать высоконадежные конфигурации, в которых данные синхронизированы между несколькими узлами. HAST реализован в виде работающего на уровне пользователя демона hastd, использующего стандартный класс GEOM Gate для обработки запросов ввода/вывода. Hastd, обеспечивает синхронную репликацию блочных устройств поверх TCP/IP сетей, независимо от типа накопителя и файловой системы. HAST предусматривает возможность быстрого восстановления после сбоя, причём, при выходе из строя первичного master-узла, его функции могут быть делегированы slave-узлу. После проверки и монтирования UFS раздела или импорта ZFS пула на поврежденном узле, система автоматически синхронизирует внесенные за время восстановления изменения и продолжит работу без потери данных.

Для быстрого развёртывания хранилищ удобно использовать дистрибутив FreeNAS. К сожалению в настоящее время FreeNAS не поддерживает HAST из коробки, но так как во FreeNAS используются стандартные компоненты FreeBSD 8.x, ни что не мешает самостоятельно вручную создать и надстроить работу подобных хранилищ.

После первой загрузки FreeNAS настроим параметры сетевого доступа и DNS. Первый узел freenas1 будет иметь IP 192.168.137.31, а второй freenas2 - 192.168.137.32. После первичной типовой настройки подключимся к shell.


++ Настройка узла HAST

Перемонтируем корневой раздел для обеспечения возможности записи:

  mount -uw /

Создадим массив хранения RAID3 из дисков da1, da2, da3.

   graid3 label gr0raid3 da1 da2 da3

В итоге будет создано устройство /dev/raid3/gr0raid3

Включим поддержку CARP и активируем демон hastd:

   cat <<EOF >> /conf/base/etc/rc.conf
   ifconfig carp0 create
   ifconfig carp0 vhid 1 pass freenashast 192.168.137.30/24
   # enable HAST daemon
   hastd_enable="YES"
   EOF

Если в директории  /boot/kerneldaemon отсутствует модуль if_carp.ko, скопируем его из системы на базе FreeBSD 8.2 или 8.3.

Создадим файл конфигурации hast.conf, в котором определим /dev/raid3/gr0raid3 в качестве синхронизируемого между узлами хранилища:

   cat <<EOF > /conf/base/etc/hast.conf
   resource freenashast {
        on freenas1 {
                local /dev/raid3/gr0raid3
                remote freenas2
        }
        on freenas2 {
                local /dev/raid3/gr0raid3
                remote freenas1
        }
   }
   EOF

Копируем hast.conf в директорию /etc и перезагружаем систему:

   cp /conf/base/etc/hast.conf /etc

Создаём хранилище hast:

   hastctl create freenashast

После появления устройства /dev/hast/freenashast назначаем текущему узлу роль первичной системы:

   hastctl role primary freenashast

Создаём zpool в хранилище freenashast

   zpool create -m /mnt gr0 /dev/hast/freenashast

Создаём символическую ссылку на директорию RAID3, чтобы web-интерфейс FreeNAS распознал вручную созданное хранилище:

   ln -s /dev/hast/freenashast /dev/raid3/gr1raid3

После этого в GUI FreeNAS можно автоматически импортировать раздел gr0 и настроить совместный доступ  с использованием штатного web-интерфейса.


Настроим демон devd для переключения HAST из режима master в slave и наоборот в зависимости от состояния сетевого линка:

   cat <<EOF >> /conf/base/etc/devd.conf
   notify 30 {
        match "system" "IFNET";
        match "subsystem" "carp0";
        match "type" "LINK_UP";
        action "/usr/local/sbin/carp-hast-switch master";
   };

   notify 30 {
        match "system" "IFNET";
        match "subsystem" "carp0";
        match "type" "LINK_DOWN";
        action "/usr/local/sbin/carp-hast-switch slave";
   };
   EOF

Создадим скрипт hast-carp-switch, который будет выполнять переключение режимов:

   cat <<EOF > /usr/local/sbin/carp-hast-switch

   #!/bin/sh
   resources="freenashast"
   zfspool="gr0"
   delay=3
   log="local0.debug"
   name="carp-hast"

   case "$1" in
        master)
                logger -p $log -t $name "Switching to primary provider for $resources."
                # in order to wait for the original primary provider to change role state
                # otherwise, brain-split may happen
                sleep $delay
                for disk in $resources; do
                        # ensure that this storage can be switched                        
                        while $(pgrep -lf "hastd: $disk \(secondary\)" > /dev/null 2>&1 ); do
                                sleep 1
                        done

                        # Switch role for each disk
                        hastctl role primary $disk
                        if [ $? -ne 0 ]; then
                                logger -p $log -t $name "Unable to change role to primary for resouce ${disk}."
                                exit 1
                        fi
                done

                # Wait for the /dev/hast/* devices to appear
                for disk in $resources; do
                        for I in $(jot 60); do
                                [ -c "/dev/hast/${disk}" ] && break
                                sleep 0.5
                        done
                        if [ ! -c "/dev/hast/${disk}" ] ; then
                                logger -p $log -t $name "GEOM provider /dev/hast/$disk did not appear."
                                exit 1
                        fi
                done

                logger -p $log -t $name "Role for HAST resources switched to primary."

                logger -p $log -t $name "Importing ZFS pool."
                zpool import -f $zfspool

                # restart the enabled services
                for srv in $(sqlite3 /data/freenas-v1.db "select srv_service from services_services where srv_enable=1" \
                                | xargs printf "grep 'bool_.*%s' /etc/rc.conf.local\n" | sh | awk '{print $2}')
               do
                         case $srv in
                             winbindd_enable|samba_enable) /etc/local/rc.d/samba restart
                                        ;;
                             netatalk_enable)        /etc/local/rc.d/netatalk restart
                                        ;;
                             proftpd_enable)         /etc/local/rc.d/proftpd restart
                                        ;;
                             inetd_enable)           /etc/rc.d/inetd restart
                                        ;;
                             nfs_server_enable)      /etc/rc.d/nfsserver restart
                                        ;;
                             mountd_enable)          /etc/rc.d/mountd restart
                                        ;;
                             nfsd_enable)            /etc/rc.d/nfsd restart
                                        ;;
                             rsyncd_enable)          /etc/local/rc.d/rsyncd restart
                                        ;;
                         esac
              done

                ;;

        slave)
                logger -p $log -t $name "Switching to secondary provider for $resources."
                # stop the running services
                for srv in $(sqlite3 /data/freenas-v1.db "select srv_service from services_services where srv_enable=1" \
                                | xargs printf "grep 'bool_.*%s' /etc/rc.conf.local\n" | sh | awk '{print $2}')
               do
                         case $srv in
                             winbindd_enable|samba_enable) /etc/local/rc.d/samba stop
                                        ;;
                             netatalk_enable)        /etc/local/rc.d/netatalk stop
                                        ;;
                             proftpd_enable)         /etc/local/rc.d/proftpd stop
                                        ;;
                             inetd_enable)           /etc/rc.d/inetd stop
                                        ;;
                             nfs_server_enable)      /etc/rc.d/nfsserver stop
                                        ;;
                             mountd_enable)          /etc/rc.d/mountd stop
                                        ;;
                             nfsd_enable)            /etc/rc.d/nfsd stop
                                        ;;
                             rsyncd_enable)          /etc/local/rc.d/rsyncd stop
                                        ;;
                       esac
                done

                # export the zfs pool & change role to slave
                for disk in $resources; do
                        zpool export -f $zfspool
                        sleep $delay
                        hastctl role secondary $disk 2>&1
                        if [ $? -ne 0 ]; then
                                logger -p $log -t $name "Unable to switch role to secondary for resource $disk."
                                exit 1
                        fi
                        logger -p $log -t name "Role switched to secondary for resource $disk"
                done
                ;;
        *)
                logger -p $log -t $name "Usage: $0 "
                exit 1
                ;;
   esac

Поменяем права доступа и перезагрузим систему:

   chmod +x /usr/local/sbin/carp-hast-switch
   reboot

После перезагрузки вручную установим первичный режим HAST для созданного хранилища:

   hastctl role primary freenashast

Выше представленная инструкция рассчитана на создание master-узла. Для запасного slave-узла, который возьмёт на себя управление в случае сбоя первичного узла, настойка выполняется аналогично, за одним исключением - для интерфейса carp0 должен быть установлен меньший приоритет, чем на master-узле:

   ifconfig carp0 vhid 1 pass freenashast advskew 100 192.168.137.30/24

URL: http://qq929962616.72pines.com/2012/03/configure-highly-avai.../
Обсуждается: http://www.opennet.ru/tips/info/2723.shtml

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от johndoe email on 28-Дек-12, 11:35 
Почему просто не использовать FreeBSD? Ведь удобнее же! Мало того что этот FreeNAS тормозит, так ещё и кучу неудобств в использовании: ни тебе обновлений вовремя, ни портов-пэкеджей, плюс куча граблей типа перезаписываемых конфигов и тд. _Зачем_??
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Аноним (??) on 28-Дек-12, 12:04 
FreeNAS-ом очень удобно управлять через web с рабочей станции, для домашнего хранилища самое то. Загрузился и всё уже из коробки работает, не нужно что-то настраивать и устанавливать.
Ответить | Правка | ^ к родителю #1 | Наверх | Cообщить модератору

3. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Сержант Скотч on 28-Дек-12, 12:29 
И для этого дома надо держать 2 ноды?
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

4. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от hypro on 28-Дек-12, 13:19 
насколько оно стабильно?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

6. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Аноним (??) on 29-Дек-12, 07:01 
оно стабильно при следующих условиях:
1. все стандартные скирпты ты выкидываешь на помойку и пишешь свои, учитывая всякие разные внештатные ситуации.
2. настраиваешь мониторинг, который тебе будет говорить о внештатных ситуациях и оперативно на них реагируешь.
Ответить | Правка | ^ к родителю #4 | Наверх | Cообщить модератору

5. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Аноним (??) on 29-Дек-12, 06:58 
а теперь представляем: падает твой мастер-узел и лежит сутки, пока ты бегаешь за сгоревшей железкой. В момент починки у тебя выключают свет на часок и ложится еще и слайв-узел. Но вот дают свет и ты запускаешь оба сервера. При поднятии главным опять становится master-узел и все твои данные за сутки ты теряешь. Ладно, автоматом hast не засинхронит slave, для этого потребуется ручное вмешательство, а это значит, что ты сможешь переключиться на slave, но вот ведь беда, заметишь ты это часика через два, когда на мастере уже тоже набегут будут какие-то уникальные изменения и тебе придется терять либо сутки, либо последние два часа. Это сложный случай с кучей не очевидностей, а теперь простой:
Какой-то глюк, мастер-нода уходит в ребут, переключаемся автоматом на слейв, записываем туда какие-то данные, поднимается master-нода, перехватывает управление на себя - о данных, которые записали на слейв можно забыть. Вопрос: а отказоустойчивое ли хранилище?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

7. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от dry (ok) on 29-Дек-12, 13:22 
Надо проверять это все, как именно работает master-slave, наверняка есть какие-то метаданные, которые не позволят мастеру стать мастером при возникшем сбое. Я не берусь утверждать что-то про HAST, поскольку не использовал его, но я использовать аналогичное решение Linux/DRBD и там такие ситуации, по крайней мере в master-slave зарешаны весьма хорошо. Есть претензии к режиму master-master, но это отдельная сложная тема.
Резюмируя, не надо делать поспешных выводов, не изучив детали.
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

11. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Аноним (??) on 29-Дек-12, 19:09 
Я пишу мысли не из головы. Я пользуюсь hast-ом уже больше года.
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

16. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от табуреткин on 09-Янв-13, 20:30 
> Я пишу мысли не из головы. Я пользуюсь hast-ом уже больше года.

а откуда у тебя мысли вылазят?

Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

15. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от нононимо on 07-Янв-13, 20:47 
> Надо проверять это все, как именно работает master-slave, наверняка есть какие-то метаданные,
> которые не позволят мастеру стать мастером при возникшем сбое. Я не
> берусь утверждать что-то про HAST, поскольку не использовал его, но я
> использовать аналогичное решение Linux/DRBD и там такие ситуации, по крайней мере
> в master-slave зарешаны весьма хорошо. Есть претензии к режиму master-master, но
> это отдельная сложная тема.
> Резюмируя, не надо делать поспешных выводов, не изучив детали.

Самая интересная тема здесь это поведение в ситуации split brain, и она не раскрыта

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

8. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от anonchik on 29-Дек-12, 14:04 
Вам забыли сказать, что FreeNAS сдох и вместо него уже давно пилят NAS4Free. В последнем все манипуляции - штатные и делаются несколькими кликами в вебморде.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

9. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Аноним (??) on 29-Дек-12, 14:15 
> Вам забыли сказать, что FreeNAS сдох и вместо него уже давно пилят
> NAS4Free. В последнем все манипуляции - штатные и делаются несколькими кликами
> в вебморде.

FreeNAS ещё все эти форки переживёт, последний релиз FreeNAS вышел 14 декабря, а новая тестовая версия - вчера. NAS4Free в этом время буксует на ровном месте и обещаниями кормит.

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

10. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от anonchik on 29-Дек-12, 14:25 
Какими обещаниями? Все то что описано в топике там уже давно реализовано из коробки и прикручено к вебморде. Где ваш FreeNAS теперь?
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

12. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Mr. Sneer on 02-Янв-13, 21:05 
Немного не по теме: а кто-нибудь сравнивал производительность FreeBSD/HAST и Linux/DRBD ? Что быстрее? Особенно интересно было бы узнать результаты при использовании СУБД (Oracle и MySQL)в качестве "нагрузки".
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

13. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от Forth email(??) on 03-Янв-13, 12:25 
Предположу, что большой разницы не будет. Синхронная реплика в сетях tcpip ограничена по iops-ам существенно, в идельном случае ~2000-3000 IOPS-ов.
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

17. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от aprogrammer email on 20-Сен-15, 12:26 
Спасибо за статью. Очень полезная штука - настраивал под Ubuntu (http://sysadm.pp.ua/linux/carp-ubuntu.html) кластер из трех серверов - до сих пор на проде работает. Не подскажите, если ли возможность(технология) для geodistributed redundent IP, может сталкивались ? Заранее спасибо.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

19. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от фвввввввв on 08-Май-16, 16:08 
В этой серии статей освещены некоторые подходы
https://habrahabr.ru/company/ivi/blog/236065/
Ответить | Правка | ^ к родителю #17 | Наверх | Cообщить модератору

18. "Создание отказоустойчивого хранилища на базе FreeBSD или Fre..."  +/
Сообщение от karlen email on 26-Янв-16, 00:51 
http://livesurf.ru/promo/219687 Программа автосерфинга
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема


  Закладки на сайте
  Проследить за страницей
Created 1996-2018 by Maxim Chirkov  
ДобавитьПоддержатьВебмастеруГИД  
Hosting by Ihor