The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Представлен проект Lumberjack, нацеленный на модернизацию си..., opennews (??), 02-Мрт-12, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


48. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от anonymous (??), 02-Мрт-12, 15:30 
Слишком много букв. Но что делать, если утилита посчитает бинарный лог испорченным и пошлёт куда подальше? Представляется ли возможным что-то быстро предпринять на коленке в таком вот экстренном случае?
Ответить | Правка | Наверх | Cообщить модератору

51. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  –1 +/
Сообщение от Аноним (-), 02-Мрт-12, 15:47 
Снова на второстепенные вещи отвлекаетесь:

1. Много букв потому то в тексте подробности (внезапно?).
2. Утилита утилите рознь (тут надо смотреть на реализацию утилиты и, особенно, на формат логов (бинарность логов не обязательно подразумевает их архивацию в сполшной solid-архив; можно сжимать на уровне сообщения/строк/записи и т.д.) ).

Ответить | Правка | Наверх | Cообщить модератору

53. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Аноним (-), 02-Мрт-12, 15:52 
Это важный вопрос, но не первой важности, т.к. он не определяет архитектуру и возможности. А разговоры именно об этом
Ответить | Правка | К родителю #48 | Наверх | Cообщить модератору

57. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Аноним (-), 02-Мрт-12, 16:01 
Об этом и речь была. Цитирую: "разница между бинарными и текстовымы форматами хранения не несет сколько-нибудь принципиальной разницы". Ключевое здесь: "не несет принципиальной разницы". Просто часть читающих опеннета не осиливает текст моего сообщения (да куда там до понимания сути сообщения когда часть тут новости (пересказ в кратком изложении) не осиливает даже на половину).
Ответить | Правка | Наверх | Cообщить модератору

90. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  –1 +/
Сообщение от Аноним (-), 02-Мрт-12, 17:46 
> Об этом и речь была. Цитирую: "разница между бинарными и текстовымы форматами
> хранения не несет сколько-нибудь принципиальной разницы". Ключевое здесь: "не несет принципиальной
> разницы". Просто часть читающих опеннета не осиливает текст моего сообщения (да
> куда там до понимания сути сообщения когда часть тут новости (пересказ
> в кратком изложении) не осиливает даже на половину).

Разница между текстовым и бинарным форматом - логическое следствие разницы между структурированными и неструктурированными данными.
Нет, конечно, можно и текстовые данные структурировать (JSON там, XML), но не на таких объемах, как в случае с логами.

Ответить | Правка | Наверх | Cообщить модератору

100. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Аноним (-), 02-Мрт-12, 19:17 
>Разница между текстовым и бинарным форматом - логическое следствие разницы между структурированными и неструктурированными данными.

Вы не врубаетесь в самую суть: формат хранения логов это второстепенные вещи и нет никакой проблемы перегнать с одного формата в другой.

>Нет, конечно, можно и текстовые данные структурировать (JSON там, XML), но не на таких объемах, как в случае с логами.

Проблема сжать существующие логи? Или проблема навесить структуризацию на текущий способ?

Ответить | Правка | Наверх | Cообщить модератору

119. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +2 +/
Сообщение от Deffic (?), 03-Мрт-12, 01:59 
>>Разница между текстовым и бинарным форматом - логическое следствие разницы между структурированными и неструктурированными данными.
> Вы не врубаетесь в самую суть: формат хранения логов это второстепенные вещи
> и нет никакой проблемы перегнать с одного формата в другой.
>>Нет, конечно, можно и текстовые данные структурировать (JSON там, XML), но не на таких объемах, как в случае с логами.
> Проблема сжать существующие логи? Или проблема навесить структуризацию на текущий способ?

Поддреживаю.
Собершенно непонятно вокруг чего проблема, если нужны структурированные данные, загоняем
логи через rsyslog в базу на удалённом сервере, параллельно можно оставить в тексте (если требуется).

Хранение логов на рабочем сервере (в любом виде) может помочь только в решении системных проблем. В этом случае их структурированность совершенно необязательна, вам всё равно потребуется просматривать всё записи в логе(ах) последовательно в поисках аномалий.
Причём отдельные события могут быть абсолютно обыденными, но вот их последовательность может вам сказать об ошибке.
В этом случае разворачиваем базу в простыню? Зачем тогда загоняли в базу?


В случае взлома, локальные логи теряют смысл, так как доступ к логам/базе логов
есть у взломщика есть и изменить данные и даты не составляет особого труда.

Кто-нибудь может обьяснить, что _нужного_ умеет  "Lumberjack" ?

Ответить | Правка | Наверх | Cообщить модератору

123. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от VoDA (ok), 03-Мрт-12, 03:09 
>>Нет, конечно, можно и текстовые данные структурировать (JSON там, XML), но не на таких объемах, как в случае с логами.
> Проблема сжать существующие логи? Или проблема навесить структуризацию на текущий способ?

Проблема сделать логи структурированными. Решение этой задачи попутно решит ряд проблем таких как размер логов, падение анализаторов при добавлении новых полей, невозможность применения одинаковых анализаторов для различных приложений. Раскрою последнее утверждение: хотя данные, которые создают разные приложения в логах подобны, но различен формат и потому нет универсального анализатора.

А случае структурированных логов анализатор проверяющий кто заходил на apache с 3 до 5 однозначно будет работать и на DNS и на любых других системах потому что формат стандартизован.

Стандартизация представления логов внешним приложениям - одна из основных задач journald и subj.

Ответить | Правка | К родителю #100 | Наверх | Cообщить модератору

153. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от Имя и код (?), 03-Мрт-12, 06:44 
>>Разница между текстовым и бинарным форматом - логическое следствие разницы между структурированными и неструктурированными данными.
> Вы не врубаетесь в самую суть: формат хранения логов это второстепенные вещи
> и нет никакой проблемы перегнать с одного формата в другой.
>>Нет, конечно, можно и текстовые данные структурировать (JSON там, XML), но не на таких объемах, как в случае с логами.
> Проблема сжать существующие логи? Или проблема навесить структуризацию на текущий способ?

Она УЖЕ структурирована, в эрэфсях это чётко прописано (это свежий):


The syslog message has the following ABNF [RFC5234] definition:


      SYSLOG-MSG      = HEADER SP STRUCTURED-DATA [SP MSG]

      HEADER          = PRI VERSION SP TIMESTAMP SP HOSTNAME
                        SP APP-NAME SP PROCID SP MSGID
      PRI             = "<" PRIVAL ">"
      PRIVAL          = 1*3DIGIT ; range 0 .. 191
      VERSION         = NONZERO-DIGIT 0*2DIGIT
      HOSTNAME        = NILVALUE / 1*255PRINTUSASCII

      APP-NAME        = NILVALUE / 1*48PRINTUSASCII
      PROCID          = NILVALUE / 1*128PRINTUSASCII
      MSGID           = NILVALUE / 1*32PRINTUSASCII

      TIMESTAMP       = NILVALUE / FULL-DATE "T" FULL-TIME
      FULL-DATE       = DATE-FULLYEAR "-" DATE-MONTH "-" DATE-MDAY
      DATE-FULLYEAR   = 4DIGIT
      DATE-MONTH      = 2DIGIT  ; 01-12
      DATE-MDAY       = 2DIGIT  ; 01-28, 01-29, 01-30, 01-31 based on
                                ; month/year
      FULL-TIME       = PARTIAL-TIME TIME-OFFSET
      PARTIAL-TIME    = TIME-HOUR ":" TIME-MINUTE ":" TIME-SECOND
                        [TIME-SECFRAC]
      TIME-HOUR       = 2DIGIT  ; 00-23
      TIME-MINUTE     = 2DIGIT  ; 00-59
      TIME-SECOND     = 2DIGIT  ; 00-59
      TIME-SECFRAC    = "." 1*6DIGIT
      TIME-OFFSET     = "Z" / TIME-NUMOFFSET
      TIME-NUMOFFSET  = ("+" / "-") TIME-HOUR ":" TIME-MINUTE


      STRUCTURED-DATA = NILVALUE / 1*SD-ELEMENT
      SD-ELEMENT      = "[" SD-ID *(SP SD-PARAM) "]"
      SD-PARAM        = PARAM-NAME "=" %d34 PARAM-VALUE %d34
      SD-ID           = SD-NAME
      PARAM-NAME      = SD-NAME
      PARAM-VALUE     = UTF-8-STRING ; characters '"', '\' and
                                     ; ']' MUST be escaped.
      SD-NAME         = 1*32PRINTUSASCII
                        ; except '=', SP, ']', %d34 (")

      MSG             = MSG-ANY / MSG-UTF8
      MSG-ANY         = *OCTET ; not starting with BOM
      MSG-UTF8        = BOM UTF-8-STRING
      BOM             = %xEF.BB.BF


      UTF-8-STRING    = *OCTET ; UTF-8 string as specified
                        ; in RFC 3629

      OCTET           = %d00-255
      SP              = %d32
      PRINTUSASCII    = %d33-126
      NONZERO-DIGIT   = %d49-57
      DIGIT           = %d48 / NONZERO-DIGIT
      NILVALUE        = "-"


Что нужно ищо этому безумному, выпрашивающему бинарного формата, как Моисей Египетович манны (или маны :) )?

Ответить | Правка | К родителю #100 | Наверх | Cообщить модератору

159. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Аноним (-), 03-Мрт-12, 10:23 
>Что нужно ищо этому безумному, выпрашивающему бинарного формата

Ему раскидали то что он уткнулся лишь в поверхностные, второстепенные вещи, но он и дальше свое гнет потому что целью для него не является поиск объективной картины (придется принять факт того что форма представления все-такие вещи второстепенные), а его цель - любой ценой не оказаться не правым (возможно, у него проблемы психического плана из далекого детства и/или просто зашкаливает ЧСВ, но нам то до него и его проблем ..). Такие дела ..

Ответить | Правка | Наверх | Cообщить модератору

164. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Имя и код (?), 03-Мрт-12, 12:40 
>>Что нужно ищо этому безумному, выпрашивающему бинарного формата
> Ему раскидали то что он уткнулся лишь в поверхностные, второстепенные вещи, но
> он и дальше свое гнет потому что целью для него не
> является поиск объективной картины (придется принять факт того что форма представления
> все-такие вещи второстепенные), а его цель - любой ценой не оказаться
> не правым (возможно, у него проблемы психического плана из далекого детства
> и/или просто зашкаливает ЧСВ, но нам то до него и его
> проблем ..). Такие дела ..

И самое забавное, что своими действиями усугубляет именно в этом направлении :)

Ответить | Правка | Наверх | Cообщить модератору

170. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  –1 +/
Сообщение от Аноним (-), 03-Мрт-12, 13:37 
> Она УЖЕ структурирована, в эрэфсях это чётко прописано (это свежий):

Ну так перцы тоже решили реализовать стандарт. А то что он бинарный - ну и болт бы с ним. Я же не воняю что gzip не только бинарный но и вообще не декодируем в уме и с ножом к горлу требует утилиту gzip для работы, правда?

Ответить | Правка | К родителю #153 | Наверх | Cообщить модератору

190. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Michael Shigorinemail (ok), 03-Мрт-12, 19:30 
> Я же не воняю

Вы просто передёргиваете.

> что gzip не только бинарный

gzip, cat, $EDITOR -- универсальные, в отличие от.

Ответить | Правка | Наверх | Cообщить модератору

194. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Аноним (-), 04-Мрт-12, 01:34 
> gzip, cat, $EDITOR -- универсальные, в отличие от.

А что мешает сделать прозрачную развертку этого формата в текст как gzip это делает для сжатого формата? Ничего? Хм, так это вопрос наличия утилит делающих это.

Ответить | Правка | Наверх | Cообщить модератору

197. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Michael Shigorinemail (ok), 04-Мрт-12, 02:08 
>> gzip, cat, $EDITOR -- универсальные, в отличие от.
> А что мешает сделать прозрачную развертку этого формата в текст как gzip
> это делает для сжатого формата? Ничего?

Вот Вы (как понимаю) в #193 описали сворачивание по IP.  Попробуйте набросать структуру данных и псевдокод, который сделает разворачивание в текст.

Мне пока кажется, что получится или размазанный по данным словарик (IP-шники же приходят новые, иначе совсем узкий случай), или отдельная вспомогательная сущность.  С первым как раз в случае потоковой обработки _всего_ массива более-менее эффективная реализация просматривается (поскольку можно идти окошком по данным, пополняя словарик и зная, что при записи сперва пополнялся он, затем значения использовались в потоке).  А вот при хвалёном произвольном доступе -- что-то сходу не соображу, как выкрутиться.  Если же держать эту сущность отдельно, то gzip уже не получается, а получается нечто с набором тайных знаний в пузе о том, где эти отдельности искать, или с ключами, которые надо обязательно задать (или же фолбэк с первого на второе, не суть).

Есть старое доброе правило: не усложняй сверх необходимого.  И что-то эта молодая гвардия его не выучила, похоже -- ломят непотребства имени себя, как джоэловский MSDN camp...

PS: заметьте, это мы с Вами подразумеваем некую фиксированную схему для одного случая.  А если схемы разные... а ещё и корректируемые...

Ответить | Правка | Наверх | Cообщить модератору

228. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от VoDA (ok), 06-Мрт-12, 00:54 
>[оверквотинг удален]
> приходят новые, иначе совсем узкий случай), или отдельная вспомогательная сущность.  
> С первым как раз в случае потоковой обработки _всего_ массива более-менее
> эффективная реализация просматривается (поскольку можно идти окошком по данным, пополняя
> словарик и зная, что при записи сперва пополнялся он, затем значения
> использовались в потоке).  А вот при хвалёном произвольном доступе --
> что-то сходу не соображу, как выкрутиться.  Если же держать эту
> сущность отдельно, то gzip уже не получается, а получается нечто с
> набором тайных знаний в пузе о том, где эти отдельности искать,
> или с ключами, которые надо обязательно задать (или же фолбэк с
> первого на второе, не суть).

Вы правы - это тайный набор знаний. Его специально выделяют в отдельную сущность с доступом через API.

Опять же grep не имеет произвольного доступа - только прямое чтение. И плакальщики из этого треда уверяют, что это самый лучший вариант. Так что меняя plain-text на потоковый файл, где общие сущности живут в пополняемых словарях, получаем ускорение потокового чтения и записи (данные уже сжаты). Сам принцип сохраняется.

Ответить | Правка | Наверх | Cообщить модератору

230. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Michael Shigorinemail (ok), 06-Мрт-12, 01:17 
> Так что меняя plain-text на потоковый файл, где общие сущности живут в
> пополняемых словарях

Я и подводил пишущего к мысли, что мы, скорее всего, попадаем на мини-DB и мини-DBA, а также прочий совершенно излишний в тривиальных случаях оверхед -- за который не должны платить ресурсами и разрывом мозга те, кому он не упёрся.

Проблема этих обновленцев в том, что они усложняют тривиальный случай нужным в весьма нетривиальном вместо того, чтобы простое оставить простым, а своё громоздить в сторонке.

Ответить | Правка | К родителю #228 | Наверх | Cообщить модератору

185. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от VoDA (ok), 03-Мрт-12, 15:23 
>>>Разница между текстовым и бинарным форматом - логическое следствие разницы между структурированными и неструктурированными данными.
>> Вы не врубаетесь в самую суть: формат хранения логов это второстепенные вещи
>> и нет никакой проблемы перегнать с одного формата в другой.
>>>Нет, конечно, можно и текстовые данные структурировать (JSON там, XML), но не на таких объемах, как в случае с логами.
>> Проблема сжать существующие логи? Или проблема навесить структуризацию на текущий способ?
> Она УЖЕ структурирована, в эрэфсях это чётко прописано (это свежий):

Сам MSG не структурирован. Как по вашему задаются обязательные и дополнительные поля для MSG? никак. в этом и проблема, которую хотят вылечить.

Дальше дыры в безопасности: наличие в теле сообщения APP-NAME, PROCID, TIMESTAMP (возможно и других подобных полей). Приложение не должно иметь API для того чтобы выдать себя за другое или использовать другое время.

API должен быть подобный (псевдо код):
спикокПолейИЗначений = {
"поле1":"значение поля 1",
"IP":127.0.0.1,
};
LOG.debug("сообщение для человека без данных", списокПолейИЗначений);

И нигде не должно запрашиваться у приложения его ИМЯ, procid и дата записи. ДАТА - по факту логирования, ИМЯ и procid - по факту того кто вызвал запись. И т.п. иначе запись что приложение Маша с хоста Вася является скомпрометированной поскольку приложение может подменить и хост и собственное имя.


PS спасибо, что подтвердили мои догадки, что RFC не описывает структуру самого сообщения. Ваша цитата наглядно это показывает )))))

Ответить | Правка | К родителю #153 | Наверх | Cообщить модератору

205. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +1 +/
Сообщение от Имя и код (?), 04-Мрт-12, 04:03 
>> Она УЖЕ структурирована, в эрэфсях это чётко прописано (это свежий):
> Сам MSG не структурирован. Как по вашему задаются обязательные и дополнительные поля
> для MSG? никак. в этом и проблема, которую хотят вылечить.

...

От ёптыдь, попробую объяснить по аналогии: Вы про тисипиайпи слыхивали? Про то, что опо пакетное? Так вот: Вы сначала предлагаете "структурировать" ай-пи пакет, потом, увидев, что он сто лет в обед как имеет жёсткую структуру, замалчиваете это, при этом громогласно заявляте что дата-часть пакета не структурирована. Вот такой театр абсурда.


> PS спасибо, что подтвердили мои догадки, что RFC не описывает структуру самого
> сообщения. Ваша цитата наглядно это показывает )))))

Вы даже РФЦ не читаете? Тогда о чём Вы о кто Вы? :))

Ответить | Правка | Наверх | Cообщить модератору

229. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от VoDA (ok), 06-Мрт-12, 01:02 
> От ёптыдь, попробую объяснить по аналогии: Вы про тисипиайпи слыхивали? Про то,
> что опо пакетное? Так вот: Вы сначала предлагаете "структурировать" ай-пи пакет,
> потом, увидев, что он сто лет в обед как имеет жёсткую
> структуру, замалчиваете это, при этом громогласно заявляте что дата-часть пакета не
> структурирована. Вот такой театр абсурда.

Аналогия интересна, но не верна.

Изначальный постулат, который я развиваю это необходимость структуризации логирующего сообщения. Не только части формализованной в RFC, но всего сообщения. Чтобы IP клиента был отдельным полем с возможностью поиска или построения иной аналитики.

Кроме того RFC пропускает некоторые уязвимости. Попробую объяснить по аналогии: нужно было сделать передачу почтовых сообщение - сделали SMTP. Но сам протокол рассчитывает на ряд аксиом типа защищенности самого сервера. Уже много лет это дыры (просчеты) в протоколе позволяют спамить.

Данные RFC на логирование также имеет уязвимости, что терпимо сейчас, но в будущем может привести к повторению судьбы SMTP.


Ответить | Правка | Наверх | Cообщить модератору

131. "Представлен проект Lumberjack, нацеленный на модернизацию си..."  +/
Сообщение от Аноним (-), 03-Мрт-12, 03:52 
> Слишком много букв. Но что делать, если утилита посчитает бинарный лог испорченным

Тогда с ним делать то же что и с испорченным текстовым логом. Открыли вы текстарь а там бред. Ну и чего?

Ответить | Правка | К родителю #48 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру