>В результате "все красное", миллиарды алярмов не погасающих годамиЕсли конкретно этого разработчика/команду получающую эти алерты ситуация устраивает (может они мазахисты и любят боль, кто вы такой чтобы запрещать?) и сервис остается в рамках SLA, то в чем проблема?
Отдельный вопрос для чего вы смотрите на чужие красные дашборбы? Свою не смогли настроить?
>нет человека способного нажать кнопку "удалить нахрен" - потому что он вообще в другом отделе и ничего про мониторинг не знает
Я работаю в компании без процессов, где непонятно кто за что отвечает - виноват разумеется prometheus, а не то что меня не берут на нормальную работу.
В девляпс мире разделение на админов (опсов) и разработчиков уже исчезло. Есть программные инженеры - они всем и занимаются, пишут приложения, конфигурации развертывания и мониторинга для него.
Ваша ситуация (непонятно кому жать кнопку) как раз таки из тухлого забикс мирка: где мониторинг отдельно, развертывание отдельно, само приложение отдельно. И чтобы получить какую-то работоспособность всего этого, нужно проделать какие-то невероятные усилия по мышковозюку и тыканию кнопочек.
В девляпс мире чтобы получить ВСЕ это работоспособным, нужно просто унаследоваться от готового шаблона и покрутить в единичных деталях.
В девляпс мире код самого приложения, конфигурация его развертывания и алертинга лежат в одном репозитории. Нет совершенно никакой проблемы найти ни по контейнеру, ни по алерту, ни тем более репозиторию к кому нужно обратиться.
Продолжайте, да, рассказывать байки про девляпсов. Я полагаю у вас там так же как с прометеем выше... не берут.
мимо девляпс