forum.opennet.ru

"Тематический каталог: Обработка log-файла почтового сервера Postfix (postfix log statistic)"

Форум Разговоры, обсуждение новостей
Версия для распечатки	Пред. тема \| След. тема

Исходное сообщение

[ Отслеживать ]

Подсказка: Ссылки "<<" и ">>" открывают первые и последние 10 сообщений.

. "Обработка log-файла почтового сервера Postfix (postfix log s..."	+/–
Сообщение от Skif (??), 05-Май-06, 13:33
>P.S. >Vershinin Egor, мне самому приходилось писать подобные скрипты для анализа работы сервера. >получалось немногим лучше (если не хуже в некоторых задачах). >Хранить статистику в БД разумно, логи - нет (у Вас получается хранение >чего-то среднего). Опытным путем пришел к тому, что необходимо иметь набор >шаблонов grep для фильтрации интересующей меня информации из лога и еще >набора специализированных скриптов для ее анализа. Это позволяет решать как текущие >задачи администрирования, так и получать статистику. Ну зачем же так человека расстраивать...:) Все же вектор напрвлености нужно задать правильный. Да и те скрипты и бинарники, которыми выпользуетесь начинались с такого же. Только разница в том, что они пользуют временные файлы, а не таблицы. Касательно же сабжа, то здесь гораздо важнее правильно организовать структуру БД и таблиц. То бишь, к чему я веду. Лог в случае его хранения в БД ни вкоем случае нельзя ложить в обну таблицу. Минимум две. Потому что при выборках из таблиц нарушается самый главный принцип БД. В одной ячейке находиться куча данных, которые повторяются. Кстати в этом плане показателен exim, который хранит свой лог в трех файлах. К чему бы это? :) (так наводящая шутка в сторону) Второе. Для риалтайма статистики необходимо вешать pipe на лог или еще какой изврат придумывать. Объясню зачем - что бы уменьшить нагрузку на проц/память в процессе предварительного парсинга лога и раскидывании по таблицам. Многие данные надо просто банально продумать на начале проектирования. То есть сесть с логом типичным. Хотя бы на 50-100 строк. Посмотреть какие данные проходят. что надоть, что нет. Взять лист бумаги и нарисовать таблички. Потом связи между ними. Взять еще один и снова. Но уже на основе предыдущего. И так до тех пор, пока у вас не окажетьсяв итоге несколько таблиц. в которых будут присутсвовать минимум данных. и минимум будет повторятся. Плюс доводите до того, что бы всякие varchar сводились тоже к минимуму. Например смысл присутствия имя hostname если его можно заменить на 1, введя дополнительно таблицу: +--+---------+ \|id\| hostname\| +--+---------+ \| 1\|server.ua\| +--+---------+ \| 2\|server.ru\| +--+---------+ Даже в случае если используется только один сервер какой прирост, плюс уменьшение объема места, засчет использования не 4-х байт, а 2-х, например (точно размерность не вспомню для varchar и того же smallint). Введение правильных ключей при частых выборках, а не раз впятилетку, позволит добиться того, что если например при выполнении первого запроса выборка шла 5 минут, то второй пробежиться за минуту. На что я выше кстати уже указал. Еще раз возвращаясь к структуре таблицы primary key(month,day,time) все же выбран неудачно, так как нагрузка у автора явно маленькая и письма ходят редко, то ему оно подойдет, а вот на больших объемах нет - так как очень часто primary key будет повторятся, соответственно в базу данные попадать не будут (дублирование primary невозможно по определению). ТО есть, Женя, Мысль у тебя хорошая. И даже нужная. Только еще сырая. Я сам такую гадость сейчас пишу. Только я пишу не единичную, а суммарную для нескольких серваков. Потому так и разжевываю, что и зачем. Касательно предыдущих ораторов, того же Сергея, могу сказать, что скорее всего статистику они генерят один раз и забывают об этом. Если тебе нужен именно такой вариант, то то, что ты написал, действительно не имеет смысла, если нужно, что-то более серьезное - тогда продолжай копать. Для меня такая проблема встала, когда пришлось частенько парсить логи нескольких почтовиков, при чем у каждого он разросся от полутора до 2-х с половиной гигов. И просто статистика типа сколько от и до пользователя прошло писем мне была не нужна. Мне нужны были данные, как прошло конкретное письмо в конкретном интервале времени,возможность вернуть лог полностью и касательно одного письма, и т.д. А это уже слишком специфичные задачи и большинству они нафиг не нужны.
Ответить \| Правка \| Наверх \| Cообщить модератору

Оглавление

Тематический каталог: Обработка log-файла почтового сервера Postfix (postfix log statistic), auto_topic, 04-Май-06, 17:50 [смотреть все]

Так, мелкие замечания month varchar 10 , day char 2 -почему не заменить на тип , Skif, 04-Май-06, 17:50 (1)
Большое спасибо за замечания - учту в будущем Честно говоря это мой первый опыт , Vershinin Egor, 04-Май-06, 18:37 (2)
Чтобы опыту набраться, можно и такие скрипты писать, для реальных же задач даже , Algor, 05-Май-06, 07:10 (3)
Согласен с AlgorКогда логи сервака занимают по 300-400 метров в день, особо с БД, Сергей, 05-Май-06, 07:33 (4)
А может Вы проверите эту программу на своих логах и сообщите результат У меня та, Vershinin Egor, 05-Май-06, 08:06 (5)
Я тестировал эту программу на логах в 2 Мб и 25 Мб Без записи в БД, со сбросом , Vershinin Egor, 05-Май-06, 08:11 (6)
to Vershinin EgorПрогоню попробую Но смысла в этом нет Для больших логов гора, Сергей, 05-Май-06, 08:31 (7)
Примерно 450 кб, Vershinin Egor, 05-Май-06, 08:34 (8)
1 Интересно как поведет себя скрипт, если в конец файла var log maillog будут , Kuzmich, 05-Май-06, 08:49 (9)
to Vershinin Egorниче он у меня в логах не обнаружил 21 03 2006 23 59 59 KRAT xx, Сергей, 05-Май-06, 08:56 (10)
прогнал я скрипт с большим логом 310Mб памяти сожрал во время выполнения 128Мб , Сергей, 05-Май-06, 10:52 (11) //
- Ну зачем же так человека расстраивать Все же вектор напрвлености нужно зада , Skif, 05-Май-06, 13:33 (12) //
  - Извини, не Женя, а Егор , Skif, 05-Май-06, 13:43 (13)
  - Всеми руками-ногами присоединяюсь Конечно, почти так Точнее, интересующую меня , Сергей, 05-Май-06, 14:03 (14)
Здравствуйте товарищи а как можно брать каждные 2 минуты и вставлять их в таблиц, Жириновский, 07-Сен-08, 20:46 (15)
или нужно синхронизировать с помощью XML или еще как-то можно , Жириновский, 07-Сен-08, 20:48 (16)
синхронизировасть с помощю дампа с Storable наверное надо , Жириновский, 08-Сен-08, 16:26 (17)
Я у себя сдела primary keymonth day time mailfrom rcptto,а то иначе теряются, Watcher, 13-Янв-09, 08:44 (18)
при обработке выдаетDBD mysql st execute failed Column month cannot be null, Avolon, 21-Янв-09, 13:01 (19)
to Avolon попробуй убери rec id - client ne 127 0 0 1 вместо етого ип про, Серга, 20-Апр-10, 20:42 (20)
подскажите как етот скрипт изменить, что бы можно было и статус письма из логов , Серга, 19-Май-10, 19:00 (21)
mail log примерно 415 метровотработал приблизительно за минуты 3Спасибо , Scales, 20-Май-10, 12:24 (22)
как добавить год нужно чтобы в базу писался в отдельную колонку год Никак не м, Евгений, 27-Окт-15, 14:21 (23)

Форумы | Темы | Пред. тема | След. тема

Партнёры:

Хостинг:

Закладки на сайте
Проследить за страницей

Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру