The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Представлен проект Lumberjack, нацеленный на модернизацию си..., opennews (??), 02-Мрт-12, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


59. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от Аноним (-), 02-Мрт-12, 16:17 
> прекрасно делаются, сами журнальные записи тоже текстовые

Анализировать быстро и на автомате и ловить потенциально интересные эвенты довольно геморно. В случае структурированности можно быстро и просто фильтрануть, например. Или отсортировать по критерию. В случае текста надо какие-то костыли. Грепать или индексить всю портянку на 20 гигз можно и задолбаться. А когда она уже в удобном виде - почему бы и нет?

Ответить | Правка | К родителю #6 | Наверх | Cообщить модератору

78. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от Аноним (-), 02-Мрт-12, 17:25 
> Анализировать быстро и на автомате и ловить потенциально интересные эвенты довольно геморно.
> В случае структурированности можно быстро и просто фильтрануть, например. Или отсортировать
> по критерию. В случае текста надо какие-то костыли. Грепать или индексить
> всю портянку на 20 гигз можно и задолбаться. А когда она
> уже в удобном виде - почему бы и нет?

Заметим, что идея грепа лога сама по себе порочна. Добавление в строку нового поля, или изменение формулировки сообщения ломает работу всех хитроумных regexpов.

Ответить | Правка | Наверх | Cообщить модератору

83. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Аноним (-), 02-Мрт-12, 17:34 
> Заметим, что идея грепа лога сама по себе порочна.

Я бы сказал 50/50, потому что гибкость - хорошая, да. И позволяет завернуть очень хитрый критерий для аналитики, которого вот так сходу может и не быть. С другой стороны, грепать 20-гиговую портянку на каждую оказию - удовольствие ниже среднего.

> Добавление в строку нового поля, или изменение формулировки сообщения ломает
> работу всех хитроумных regexpов.

Ну вот поэтому я и полагаю что в принципе сабж имеет право на жизнь, ЕСЛИ оставят нормальный интерфейс для грепалок на случай когда надо завернуть какую-то хитрозагнутую аналитику, скорость которой не важна, а вот готового тулса не оказалось и все тут, так что цепочка грепов - единственный простой вариант.

Ответить | Правка | Наверх | Cообщить модератору

87. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от Аноним (-), 02-Мрт-12, 17:41 
> Я бы сказал 50/50, потому что гибкость - хорошая, да. И позволяет
> завернуть очень хитрый критерий для аналитики, которого вот так сходу может
> и не быть.

Хм. Вы когда-нибудь с SQL работали? Скажу по секрету: там возможностей для хитрой аналитики куда больше, чем в простом грепе =)
Логично, что для работы со структурированными данными, будет использоваться язык структурированных запросов (a.k.a. SQL), или некий его аналог.

Ответить | Правка | Наверх | Cообщить модератору

125. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от Anonymouse (?), 03-Мрт-12, 03:13 
>Хм. Вы когда-нибудь с SQL работали? Скажу по секрету: там возможностей для хитрой аналитики куда больше, чем в простом грепе =)

Practical Extraction and Report Language. На SQL-е - умахаешься.
Впрочем поЦерингов это не остановит :(

Ответить | Правка | Наверх | Cообщить модератору

130. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +2 +/
Сообщение от Аноним (-), 03-Мрт-12, 03:50 
> Хм. Вы когда-нибудь с SQL работали? Скажу по секрету: там возможностей для
> хитрой аналитики куда больше, чем в простом грепе =)

1) Я не считаю что для анализа логов мне надо бросить все и стать DBA
2) Я не считаю что для анализа логов мне надо бросить все и стать SQL programmer.
3) Базы SQL в общем случае не отличаются скоростью и компактностью.
4) Оно слишком много всего умеет: перспектива словить SQL injection в системе логгинга - здорово придумано. А что, пусть хакер и ломится через систему логгинга сразу.
5) В общем случае SQL базы не дизайнились быть устойчивыми от хакинга, удаления записей задним числом без простого обнаружения этого факта, etc.

Ответить | Правка | К родителю #87 | Наверх | Cообщить модератору

213. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от cosmonaut (ok), 04-Мрт-12, 12:09 
>Скажу по секрету: там возможностей для хитрой аналитики куда больше, чем в простом грепе =)

Т.е. вы хотите сказать, что DSL, коим является SQL имеет больше возможностей, чем тьюринг-полный язык (bash+grep+tools+sed+awk)?
А где такая трава продается? :)

Ответить | Правка | К родителю #87 | Наверх | Cообщить модератору

99. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от Аноним (-), 02-Мрт-12, 18:38 
> Заметим, что идея грепа лога сама по себе порочна. Добавление в строку
> нового поля, или изменение формулировки сообщения ломает работу всех хитроумных regexpов.

Да, вспоминается, как аккуратненько добавил разок дополнительное поле в конец лог-строки апача. И все, вебалайзер тут же загнулся.

Ответить | Правка | К родителю #78 | Наверх | Cообщить модератору

117. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от anonimous (?), 03-Мрт-12, 00:26 
> Анализировать быстро и на автомате и ловить потенциально интересные эвенты довольно геморно.
> В случае структурированности можно быстро и просто фильтрануть, например. Или отсортировать
> по критерию. В случае текста надо какие-то костыли. Грепать или индексить
> всю портянку на 20 гигз можно и задолбаться. А когда она
> уже в удобном виде - почему бы и нет?

Узкое место --- не в чтении/парсинге/поиске, в записи. (поиск --- значительно более редкая и менее требовательная к скорости получения результата операция, по сравнению с записью).

Ответить | Правка | К родителю #59 | Наверх | Cообщить модератору

142. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  –1 +/
Сообщение от Имя и код (?), 03-Мрт-12, 05:16 
>> прекрасно делаются, сами журнальные записи тоже текстовые
> Анализировать быстро и на автомате и ловить потенциально интересные эвенты довольно геморно.
> В случае структурированности можно быстро и просто фильтрануть, например. Или отсортировать
> по критерию. В случае текста надо какие-то костыли. Грепать или индексить
> всю портянку на 20 гигз можно и задолбаться. А когда она
> уже в удобном виде - почему бы и нет?

Не-а, бинарь в принципе не удобен. Эт раз.
Для первичного анализа берутся не сами логи, но уже очищенные от инфошума, эт два.
И тока ежели оно действительно дальше нуна (отрицательная вероятность), берётся часть простыни, локализированная по.

Ответить | Правка | К родителю #59 | Наверх | Cообщить модератору

166. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от zzz (??), 03-Мрт-12, 13:18 
> Не-а, бинарь в принципе не удобен. Эт раз.

Бинарь в принципе ничем не отличается от текстаря. Поскольку вы не читаете сектора диска напрямую с DMA с блинов в мозг, так или иначе нужны какие-то программы. В каком именно они варианте данные прочтут мне не так уж принципиально. Если это потом можно удобным утилям скормить. Кстати gzip вы в уме вообще нифига не распакуете, если уж на то пошло.

> Для первичного анализа берутся не сами логи, но уже очищенные от инфошума, эт два.

1) Чистить вотпрямща 100500 гигз логов за последнюю неделю - довольно не прикольное начинание. А критерии того что есть шум становятся известны вот сей момент и только так.
2) Опять же, в рантайм в реальном времени все это делать неудобно.
3) А еще у кучи демонов разные форматы логов.

> И тока ежели оно действительно дальше нуна (отрицательная вероятность),
> берётся часть простыни, локализированная по.

Что есть отрицательная вероятность? :)

Ответить | Правка | Наверх | Cообщить модератору

204. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Имя и код (?), 04-Мрт-12, 03:56 
>> Не-а, бинарь в принципе не удобен. Эт раз.
> Бинарь в принципе ничем не отличается от текстаря. Поскольку вы не читаете
> сектора диска напрямую с DMA с блинов в мозг, так или
> иначе нужны какие-то программы.

Не текстовый формат весьма и весьма не удобен. Малоюзабелен.


> В каком именно они варианте данные прочтут
> мне не так уж принципиально. Если это потом можно удобным утилям
> скормить. Кстати gzip вы в уме вообще нифига не распакуете, если
> уж на то пошло.
>> Для первичного анализа берутся не сами логи, но уже очищенные от инфошума, эт два.
> 1) Чистить вотпрямща 100500 гигз логов за последнюю неделю - довольно не
> прикольное начинание. А критерии того что есть шум становятся известны вот
> сей момент и только так.

Никто вотпрямща и не чистит, кстати.

> 2) Опять же, в рантайм в реальном времени все это делать неудобно.

Очень удобно. Если, конечно, Вы не собираетесь делать это ручками.


> 3) А еще у кучи демонов разные форматы логов.

Тем паче текстовый формат.


>> И тока ежели оно действительно дальше нуна (отрицательная вероятность),
>> берётся часть простыни, локализированная по.
> Что есть отрицательная вероятность? :)

Это вероятность, меньшая нулевой :)

Ответить | Правка | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру