В прошедшие выходные обновил FreeBSD v7.0-RELEASE до FreeBSD v7.1-STABLE:
>-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-<FreeBSD xxx.xx 7.1-STABLE FreeBSD 7.1-STABLE #4: Sat Jan 31 17:43:06 MSK 2009 xxx@xxx.xx:/usr/obj/usr/src/sys/GW amd64
>-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-=-<Система используется, как шлюз в Internet. Из тяжеловесного из портов установлено сведущее: asterisk-1.4.21.2_5, mysql-server-5.0.67, zaptel-1.4.6_7, netams-3.4.2 и openvpn-2.0.6_9. Только последние трое пересобирались после обновления ОС, остальное не трогалось.
После этого система уже дважды подвисала с несколько странными симптомами. Ни с того, ни с сего сессия SSH замирает, Asterisk не работает, тунель OpenVPN отваливается. Но при этом сервер пингуется, продолжает работать маршрутизация и natd. Попытка залогиниться с консоли не удается: переключение между виртуальными консолями происходит, однако, реакции на нажатия клавиш для ввода имени никакой нет, также нет ее нет на <Ctrl>+<Alt>+<Delete>. При нажатии кнопки "Power" на системном блоке ACPI выдает сообщение на монитор о том, что система занята и ее работа не может быть завершена сейчас, поэтому процедура shutdown отменена. В общем, возникает такое ощущение, что зависают только задачи user level, хотя с другой стороны тот же natd продолжает работать. После перезагрузки сервера по кнопке "Reset" в логах нет абсолютного никакого криминала, coredumps отсутствуют, за исключением ругни со стороны mount и fsck. Даже GEOM зеркало RAID 1 не рассинхронизируется.
Впервые сервер повис с такими симптомами через ~4 часа после его включения без какой-либо нагрузки, второй инцидент повторился сегодня практически ровно через двое суток но уже под нагрузкой. Исходя из этого есть опасение, что это происходит не в последний раз. Каждое такое подвисание приводит к останову в работе офиса. Подскажите с чего следует начать попытки решить проблему.
Ты наверняка помнишь - когда обновлял свою систему? Тогда найди все обновленные файлы и проверь каждый из них. Я так думаю, что виноват какой-то драйвер. Отключи все тяжеловесные приложения (то есть закомментируй запуски их скриптов инициализации) и посмотри - не исчезнут ли проблемы.
>Ты наверняка помнишь - когда обновлял свою систему? Тогда найди все обновленные
>файлы и проверь каждый из них. Я так думаю, что виноват
>какой-то драйвер.Система обновлялась через CVSup. Честно говоря, я не вижу смысла в сравнении исходников RELENG_7_0 и RELENG_7. Что я могу там найти, не будучи программистом?
Кстати, проблема та же. Только на компе не стояло ничего, даже ipfw не был запущен. В некоторые моменты времени виснет ssh соединение, через некоторое время обратно оживает. Активности в это время по идее никакой, виснет в совершенно произвольные моменты.
>Кстати, проблема та же.Не пробовали еще сообщить на официальный сайт FreeBSD об этом? Может там уже знают о таких проблемах и уже есть информация на этот счет?
>>Кстати, проблема та же.
>
>Не пробовали еще сообщить на официальный сайт FreeBSD об этом? Может там
>уже знают о таких проблемах и уже есть информация на этот
>счет?Собственно до текущего момента я думал что это нормально, учитывая флуд пакетами в нашей локальной сети и частоту процессора 400МГц)) Буду действовать
>Не пробовали еще сообщить на официальный сайт FreeBSD об этом? Может там
>уже знают о таких проблемах и уже есть информация на этот
>счет?Поискал в базе PR. Ничего похожего нет. Похоже придется изучать науку send-pr.
>Кстати, проблема та же. Только на компе не стояло ничего, даже ipfw
>не был запущен. В некоторые моменты времени виснет ssh соединение, через
>некоторое время обратно оживает. Активности в это время по идее никакой,
>виснет в совершенно произвольные моменты.У меня есть еще один сервер, он был обновлен с 7.1-PREDRELEASE до 7.1-STABLE на сутки раньше, с ним нет таких проблем. Однако, работает эта машина, как маршрутизатор-шейпер, из приложении там ничего нет, нагрузку создают только сетевая подсистема ОС и dummynet. Аппаратная часть у обеих машин весьма схожи, конфиги ядер различаются только добавлением поддержки VLAN у подвисающего.
>останову в работе офиса. Подскажите с чего следует начать попытки решить
>проблему.Попробуйте новый планировщик SCHED_ULE вместо SCHED_4BSD
>>останову в работе офиса. Подскажите с чего следует начать попытки решить
>>проблему.
>
>Попробуйте новый планировщик SCHED_ULE вместо SCHED_4BSDПри компиляции ядра v7.1 SCHEDULER был целенаправленно изменен с 4BSD на ULE. В других источниках теперь наоборот рекомендуют вернуться обратно на 4BSD. А также отключить PREEMPTION.
Пересобрал с 4BSD и без PREEMPTION. Проблема осталась.
ради эксперимента сделай даунгрейд обратно
у меня из портов ставится netams 3.4.1rc1 даже после обновления портов.
с сайта netams я скачал порт, но он не утсановился.
подскажите, пожалуйста, как мне установить netams 3.4.2
>у меня из портов ставится netams 3.4.1rc1 даже после обновления портов.
>с сайта netams я скачал порт, но он не утсановился.
>подскажите, пожалуйста, как мне установить netams 3.4.2v3.4.2 устанавливалась именно из порта опубликованного на сайте NeTAMS.
Таже проблема, по непонятной причине отрывается SHH. Сервер продолжает работать, а подключиться к нему не получается.
Никто не нашел причину?