> Ой, в чистом Nagios что-то за пределами мониторинга доступности сервисов (с которым, он, бесспорно, справляется превосходно!), делается просто с невероятным сексом.и все-таки я не понимаю. Вы так и не написали этих таинсвенных функций, которые скрываются за формулировкой "что-то за пределами мониторинга доступности сервисов ". Что вы имеете ввиду?
> Связка с тем же кактусом, у которого более-менее нормальные графики, вообще изврат, так-как полной интеграции все равно не получится, по крайней мере в вопросе того, что бы была одна общая БД с историей.
А я и говрю что изврат! =) Почему именно кактус-то? =) На нем свет клином сошелся?
С ним да, проблем много, потому что он нафиг для графиков не нужен =) Еще раз прочитайте то, что я предлагал для решения проблем с графиками. Кактус - это бред. Так делают только люди, которые не особо шарят в данном вопросе, а только делают все по статейкам из гугла.
> Долго, честно скажу, что мне через 4 дня надоело, может, конечно, руки кривые :)) (пыталась подружить с кактусом), и представляя общий объем работы, не смотря на то, что раньше я работала с уже развернутым настроенным Nagios, решила, что он не стоит таких усилий.
туда же. Для прикручивания к PNP4Nagios нужно добавить 2 команды и исправить пару строчек в nagios.cfg. Все! и будет профит.
Про кривые руки уж не буду издеваться, но уверен, что я бы максимум за пару часов его прикрутил к кактусу. Если вы знаете кактус и нагиос, то никаких проблем возникнуть не должно.
> MySQL и централизованное хранение данных мониторинга вообще must have, если цель мониторинга не только мониторинг доступности...
не судите по себе. У всех разные цели.
> ..но и анализ сервисов
о! занавес фразы "что-то за пределами мониторинга доступности сервисов" начинает приоткрываться! Так вот что вам не хватает! Только я опять же, пока не очень понимаю смысл фразы "анализ сервисов". Так как я понимаю эту фразу - это можно сделать в Нагиосе.
> У Zabbix рулит распределенный мониторинг. Кроме того, не верю, что контора с, например, 10к серверами не сможет себе позволить под центральный сервер выделить что-то с четыремя 4-8 ядерными сокетами, шестью-восьмью SAS в raid10
Рулит, да. Только все упирается в требования.
А я верю. Только возьмите в качестве примера не "10к серверов", а 10к роутеров/свитчей. Т.е. это, например, провайдер. И тут Заббикс какбэ не особо нужен. Нафиг прову тратить большое кол-во денег на крутые железки для мониторинга, если будет хватать Нагиоса (и графики и "анализ сервисов")
> Вообще-то и под Nagios плагины часто приходится переписывать под себя.
Как и под Заббикс. Базовые функции есть и там и там.
> Мы мониторим объем _свободного_ места тоже раз в три минуты...
> ...вставить, например, в lvm дополнительный HDD, и втихаря же расширить группу томов, а потом файловые системы? По-моему, это что-то из невероятно-фантастичного :)))
Это частный случай, ничего против не имею. К чему вы это пишете, я ведь явно написал что хотел сказать той фразой. Для тех кто в танке - "совет бесполезный, у каждого свои приоритеты."
>Разумеется, с сетевых интерфейсов счетчики нужно снимать как можно чаще. Мы парсим Zabbix-ксом не непосредственно счетчики, а текстовые файлы, которые делаются скриптом на серверах по крону раз в пол-минуты (запускается два скрипта, один делает sleep 30)
А вы знаете толк в извращениях =)) вообще-то у zabbix`а есть такой функционал, встроенный в агент.
да и говорил я не про "сетевые интерфейсы(серверов)", а про "интерфейсы сетевых устройств"
> Если оборудование, и секюрити-нот-май-проблем, увы, конечно, уже сложнее выкручиваться, что бы снизить нагрузку.
Это вы о чем? не въехал
> Нет, разница в том, что nagios это joe или nano, а Zabbix это Vim или emacs: первые ничего не умеют (но их юзеры и не в претензии), а вторые безмерно навороченные для некоторых :) Имхо, конечно.
Некорректное сравнение. В таком примере не важны быстродействие и надежность.
> А есть задача проанализировать работу сервисов, например, узнать, сколько точно у Вас был какой-то итем в ночь второй субботы позапрошлого и прошлого месяца, по тому, что у Вас возникло озарение, что серверы по-очереди падают именно примерно в это время.
Все, я понял смысл "анализ сервисов". Т.е. для полного счастья вам не хватало только этого? Как вы это узнаете в Заббиксе? Правильно, из графиков. Тогда возникает логический вывод: выпрямите руки, перестаньте пользоваться вещами не предназначенными для ваших целей и прикрутите таки графики к Nagios`у! ПРОФИТ! Мало того, в том же Nagios`е можно посмотреть статистику по времени относительно перехода в различные состояния сервисов, оповещений по ним.
> Вы можете прямо не отходя от кассы сделать развернутый анализ, и только потом лезть ковыряться на syslog сервер, когда уже будете знать, что именно Вам искать.
Мало того, лезть в сислог не надо. Если вы продумываете мониторинг, то можно было бы добавить мониторинг этого лога в сам Заббикс и просто просматривать в веб морде. Т.е. лезть не надо
> Так вот, Nagios ничего подобного, без страшного с ним секса, не умеет.
Умеет, приктутите графики, и будет вам счастье. Не нужно секса с кактусом! Юзайте вещи, сделанные для самого Nagios`а. Лично я рекомендую pnp4nagios