<?xml version="1.0" encoding="koi8-r"?>
<rss version="0.91">
<channel>
    <title>OpenForum RSS: Раздел полезных советов: Полезные пакеты, которые следует установить на сервер для диагностики сбоев</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html</link>
    <description>Минимальный набор пакетов  для диагностики проблем, которые желательно заранее установить на серверы, чтобы не тратить время на установку дополнительных пакетов или поиск специализированных live-дистрибутивов. &lt;br&gt;&lt;br&gt;Установка диагностических утилит во время сбоя может превратиться в решение отдельной проблемы или потребовать много времени,  учитывая то, что во время сбоя может пропадать сетевое соединение, возникнуть проблемы с DNS, наблюдаться большие потери пакетов или снижение полосы пропускания, возникать большие задержки ввода команд из-за высокой нагрузки на CPU или исчерпания памяти, дисковый раздел может быть переведён в режим только для чтения и т.п.&lt;br&gt;&lt;br&gt;Список пакетов для предустановки (названия для Ubuntu) и поставляемые в них диагностические утилиты:&lt;br&gt;&lt;br&gt;** procps - утилиты ps, vmstat, uptime, top&lt;br&gt;** util-linux -dmesg, lsblk, lscpu (общая статистика, информация о блочных устройствах и CPU)&lt;br&gt;** sysstat - iostat, mpstat, pidstat, sar (оценка производительности)&lt;br&gt;** iproute2 - ip, ss, nstat, tc (настро</description>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (InuYasha)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#19</link>
    <pubDate>Sun, 01 Dec 2024 09:25:36 GMT</pubDate>
    <description>+iftop&lt;br&gt;&lt;br&gt;хотя современный htop, воде, уже имеет вкладку по I/O&lt;br&gt;</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (Tron is Whistling)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#18</link>
    <pubDate>Sat, 18 May 2024 15:42:56 GMT</pubDate>
    <description>Тут ожидание и реальность.&lt;br&gt;Ожидание - удалёнка, дежурная смена, whatever.&lt;br&gt;Реальность - половина нод завалилась, инженегра два на полставки, и те джуны, потому что архитекта задолбало лопатить за десятерых за полторы зарплаты, и он свалил, whatever.&lt;br&gt;</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (Tron is Whistling)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#17</link>
    <pubDate>Sat, 18 May 2024 15:41:16 GMT</pubDate>
    <description>&amp;gt; А сейчас да, проснувшись и сладко потянувшись можно днём покумекать чего там больше 5&#037; клиентов два часа утром матерились.&lt;br&gt;&lt;br&gt;И то только покумекать, потому что индусский саппорт какого-нибудь Emc2 будет спать ещё часа 4, и только потом заявку примет.&lt;br&gt;</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#16</link>
    <pubDate>Sat, 27 Apr 2024 23:32:59 GMT</pubDate>
    <description>&amp;gt;  Мир изменился потому что &quot;вчера с 5 до 7 утра по &lt;br&gt;&amp;gt; GMT у нас &amp;gt; 5&#037; клиентам отдавалась 500 ошибка, и алерты &lt;br&gt;&amp;gt; по метрикам задержек, давайте выясним что это было и как сделать, &lt;br&gt;&amp;gt; чтобы больше так не было&quot; теперь как бы норма.&lt;br&gt;&amp;gt;  Раньше был бы звонок админу в 5:03 по GMT что Вася &lt;br&gt;&amp;gt; из Зарюпинска не может работать и Маша тоже жалуется. И чтобы &lt;br&gt;&amp;gt; исправил, иначе за что тебе деньги платят.&lt;br&gt;&amp;gt;  А сейчас да, проснувшись и сладко потянувшись можно днём покумекать чего &lt;br&gt;&amp;gt; там больше 5&#037; клиентов два часа утром матерились.&lt;br&gt;&lt;br&gt;Если предприятие работает вне часовой зоны ИТ отдела, то нанимают&lt;br&gt;дежурных инженеров работающих 24/7 и не долбят мозг главному инженеру,&lt;br&gt;а решают вопросы с закончившимся местом, отвалившимся коннектом,&lt;br&gt;ошибкой маршрута самостоятельно, а вот если вопрос серьезный, то&lt;br&gt;тогда уже оформляют как положено баг репорт и решают в штатном порядке&lt;br&gt;в рабочее время. &lt;br&gt;&lt;br&gt;&lt;br&gt;При распределенной команде кстати есть шанс что ошибку отловят и исправят&lt;br&gt;и вообще в тот же час разработчики из тойже часов</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#15</link>
    <pubDate>Sat, 27 Apr 2024 23:29:19 GMT</pubDate>
    <description>Легко если обработка идет вне сетевой подсистемы Linux&lt;br&gt;Только время терять на все это ваше&lt;br&gt;</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (ant2)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#14</link>
    <pubDate>Wed, 24 Apr 2024 07:17:04 GMT</pubDate>
    <description> Мир изменился потому что &quot;вчера с 5 до 7 утра по GMT у нас &amp;gt; 5&#037; клиентам отдавалась 500 ошибка, и алерты по метрикам задержек, давайте выясним что это было и как сделать, чтобы больше так не было&quot; теперь как бы норма.&lt;br&gt; Раньше был бы звонок админу в 5:03 по GMT что Вася из Зарюпинска не может работать и Маша тоже жалуется. И чтобы исправил, иначе за что тебе деньги платят.&lt;br&gt; А сейчас да, проснувшись и сладко потянувшись можно днём покумекать чего там больше 5&#037; клиентов два часа утром матерились.&lt;br&gt;</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#13</link>
    <pubDate>Tue, 23 Apr 2024 08:37:05 GMT</pubDate>
    <description>Не совсем для сбоев, но рекомендую также ставить vnstat. Иногда очень полезно посмотреть динамику по занятости каналов. Главное ставить его заранее, чтобы статистика по трафику уже была к тому момент, когда она понядобится.&lt;br&gt;В паре с реалтаймовым мониторингом в bmon получается очень даже хорошо.&lt;br&gt;&lt;br&gt;И то и другое у меня ставится на все новые сервера даже несмотря на то, что в параллель по сути те же метрики экспортируются ещё и в prometheus. Однако, локально на сервере смотреть числа выходит гораздо удобнее.&lt;br&gt;</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#12</link>
    <pubDate>Tue, 23 Apr 2024 06:06:39 GMT</pubDate>
    <description>iotop&lt;br&gt;</description>
</item>

<item>
    <title>Полезные пакеты, которые следует установить на сервер для диагностики сбоев (Аноним)</title>
    <link>https://www.opennet.ru/openforum/vsluhforumID3/133243.html#11</link>
    <pubDate>Tue, 16 Apr 2024 08:36:28 GMT</pubDate>
    <description>Напиши свою статью, аноним, с изложением своей версии того, как делать мониторинг.&lt;br&gt;&lt;br&gt;То есть, о том, что &quot;мир изменился&quot; ты прав, но во-первых, у утилит нового мира внутри те же самые top, sysstat, vmstat.&lt;br&gt;&lt;br&gt;&amp;gt;алерты, которые делаются совершенно не этими утилитами&lt;br&gt;&lt;br&gt;А чем? Куча этих самых мониторингов -- это же те же самые обвязки над олдовыми утилитами.&lt;br&gt;&lt;br&gt;&amp;gt;EC2 инстансе, в контейнерах в EKS или другом managed kubernetes&lt;br&gt;&lt;br&gt;Хм. Я бы, конечно, не против EC2, EKS, и тому подобного, но у нас airgapped система. Как мне быть?&lt;br&gt;</description>
</item>

</channel>
</rss>
