The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Режим отображения отдельной подветви беседы [ Отслеживать ]

Оглавление

Релиз языка программирования GNU Awk 4.1.0 , opennews (?), 11-Май-13, (0) [смотреть все]

Сообщения [Сортировка по времени | RSS]


19. "Релиз языка программирования GNU Awk 4.1.0 "  –2 +/
Сообщение от Аноним (-), 11-Май-13, 22:31 
> в юниксах (да и не только) алгоритм "одна программа генерирует человекочитаемые
>> данные - другая программа их парсит" напоминает наших дорожников,
> Полная ерунда. "Write programs that do one thing and do it well."
> -- выверено опытом и "кровью". Альтернативы -- ad-hoc специализированны, переумудренные
> вещи, пользоваться которыми никто не будет и не захочет.

Альтернатива - не придумывать лишние things, чтобы не пришлось их делать. Неужели это так сложно?

> Где именно она теряется? Человекочитаемую, потому как для человека предназначена

Предназначенную для человека информацию должен читать только человек. За попытки скормить ее программам надо бить по рукам.

> Основные преимущества их суть две вещи: 1) простота, 2) скорость

Вы очень точно отметили их основные недостатки (сложность и тормознутость). Правда, непонятно, почему вы считаете их достоинствами.

> Regex выражения родом именно из awk, s(ed) Те самые выражения будут использованы и в SQL (напр., PostgreSQL) Инфа, кстати, там тоже в тексте хранится.

Если архитектор ПО феерически криворук - да. Например, запись из rsyslog в SQL. Кой мне толк от того, что оно в базу запихано, если там все равно текстовая каша?

> SQL не имеет преимущества в скорости без индексирования.

При правильной архитектуре (когда никаких regexpов нафиг не надо) - имеет, и еще какое. Просто потому, что не надо парсить текст (очень медленная и сложная работа).

> Много работы, места и т. д. К тому же нет универсальности.

Да, это безусловные недостатки plain textа.

> К тому же, все эти утилиты легко "вставляемы" в другие утилиты и
> программы, например, Emacs. Очень мило там работают. Вы что предлагаете, каждый
> раз заново изобретать менее эффективный велосипед?

Наоборот, это вы такое предлагаете :)

Ответить | Правка | Наверх | Cообщить модератору

29. "Релиз языка программирования GNU Awk 4.1.0 "  +3 +/
Сообщение от gpl77 (ok), 11-Май-13, 23:02 
>> -- выверено опытом и "кровью". Альтернативы -- ad-hoc специализированны, переумудренные
>> вещи, пользоваться которыми никто не будет и не захочет.
> Альтернатива - не придумывать лишние things, чтобы не пришлось их делать. Неужели
> это так сложно?

Уже такое было :-) Называлось OS/360 :-)


>> Основные преимущества их суть две вещи: 1) простота, 2) скорость
> Вы очень точно отметили их основные недостатки (сложность и тормознутость). Правда, непонятно,
> почему вы считаете их достоинствами.

Простота и скорость разработки. :-)
Машинное время уже давно ничего не стоит :-)


> При правильной архитектуре (когда никаких regexpов нафиг не надо) - имеет, и
> еще какое. Просто потому, что не надо парсить текст (очень медленная
> и сложная работа).

У вас опять получится OS/360.

Ответить | Правка | Наверх | Cообщить модератору

41. "Релиз языка программирования GNU Awk 4.1.0 "  +/
Сообщение от Евгений (??), 12-Май-13, 00:32 
> Вы очень точно отметили их основные недостатки (сложность и тормознутость). Правда, непонятно,  почему вы считаете их достоинствами.

Потому, что Вам нечего предъявить более простого и быстрого, (код на сях просьба не показывать :)) Есть вообще что-нибудь быстрее чем grep, sed и awk

> Если архитектор ПО феерических криворук - да. Например, запись из rsyslog в
> SQL. Кой мне толк от того, что оно в базу запихано,  если там все равно текстовая каша?

Криворук и недальновиден архитектор по имени Редмонд. Например, на Винде как не было достойной альтернативы syslog , так и нет. event viewer -- насмешка. Результат  -- на лицо, очень мало Виндоадминов вообще знает о существовании логов, как класса. Зачем майкрософту "на старости-то  лет" понадобилось приходить к выводам сформулированным задолго до них, над которыми они смеялись, как и Вы сейчас? Зачем нужно городить PS, headless server? Вы подумали бы перед тем как все и вся отвергать.


> При правильной архитектуре (когда никаких regexpов нафиг не надо) - имеет, и
> еще какое. Просто потому, что не надо парсить текст (очень медленная
> и сложная работа).

Т.е. с текстом мы не работаем вообще? xml, html, LaTeX, logs, crontab выдуманы "врагами" Шиндошс? Как мы собираемся фильтровать текст, пардон, информацию? Вам наверное не приходилось работать с гигабайтными текстами где без Emacs с его возможностями, sed, awk  и иногда перла не обойтись.

>> Много работы, места и т. д. К тому же нет универсальности.
> Да, это безусловные недостатки plain textа.

Вы попробовали сами, перед тем как делать выводы.

>> К тому же, все эти утилиты легко "вставляемы" в другие утилиты и
>> программы, например, Emacs. Очень мило там работают. Вы что предлагаете, каждый
>> раз заново изобретать менее эффективный велосипед?
> Наоборот, это вы такое предлагаете :)

Не понял, я вроде не придумываю свой сед, авк и греп. Что же мне вставлять куски текста или весь текст в БД а затем индексировать все это, при этом пить кофе и долго ждать пока все это закончится?

Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору

72. "Релиз языка программирования GNU Awk 4.1.0 "  +/
Сообщение от ffirefox (?), 12-Май-13, 17:02 
> Потому, что Вам нечего предъявить более простого и быстрого, (код на сях
> просьба не показывать :)) Есть вообще что-нибудь быстрее чем grep, sed
> и awk

Трудно говорить с человеком, который никого не слышит, кроме себя.
Для работы с тестовыми файлами удобны инструменты для работы с текстовыми данными.
Причем, главным будет _удобство_, а не скорость. Вы зря сюда C приплели. Для C есть очень хорошие библиотеки для работы с текстовой информацией. Просто в простейших случаях это как на ракете за хлебом слетать.

>> Если архитектор ПО феерических криворук - да. Например, запись из rsyslog в
>> SQL. Кой мне толк от того, что оно в базу запихано,  если там все равно текстовая каша?

Так если разработчик программы криворук, то и в тестовой каше не разберешься. Только зачем было делать тестовую кашу?

> Криворук и недальновиден архитектор по имени Редмонд. Например, на Винде как не
> было достойной альтернативы syslog , так и нет. event viewer --
> насмешка.

1. Вы даже не представляете как устроен лог в винде.
2. event viewer - это просто штатный просмоторщик быстро глянуть в лог с минимальными возможностями (cat - тоже убог ;) ). Для регулярной работы с логом есть куча инструментов,  в том числе , из всего зоопарка скриптовых языков.
3. У syslog даже на Linux  есть куча очень достойных альтернатив. Просто syslog как Cobol: на него уже столько завязано, что проще мучаться с ним, чем искать себе приключений.

> Результат  -- на лицо, очень мало Виндоадминов вообще знает
> о существовании логов, как класса.

Линадминов тоже хватает, которые не знают даже, где логи лежат. Только зачем говорить о недоучках? Может будем ориентироваться просто на админов.

> Т.е. с текстом мы не работаем вообще? xml, html, LaTeX, logs, crontab
> выдуманы "врагами" Шиндошс? Как мы собираемся фильтровать текст, пардон, информацию? Вам
> наверное не приходилось работать с гигабайтными текстами где без Emacs с
> его возможностями, sed, awk  и иногда перла не обойтись.

Для xml, html, LaTeX как и других языков разметки (и, например, парсинга исходных текстов языков программирования) надо пользоваться соответствующими парсерами. Появление этих языков разметки ( а ля SGML) было как раз следствием того, что текстовая каша надоела и нужно было генерировать удобные представления данных для разных потребителей (разные программы, разные люди).
Парсить гигабайты xml на sed или ручками в Emacs будет только сильно ограниченный в знаниях человек. XML через регэкспы в общем случае вообще не парсится.


>>> К тому же, все эти утилиты легко "вставляемы" в другие утилиты и
>>> программы, например, Emacs.

Откройте для себя кроме Emacs огромный мир unix утилит и языков.  Перестаньте делать руками то, что должен делать компьютер. Не надо уподобляться начинающим пользователям виндов, которые все тащат в MS Word т.к. там им привычно работать на макросах VB.

> Не понял, я вроде не придумываю свой сед, авк и греп. Что
> же мне вставлять куски текста или весь текст в БД а
> затем индексировать все это, при этом пить кофе и долго ждать
> пока все это закончится?

Нет. Просто Вам говорят, что хватит петь аллилую текстовым логам с кашей в виде данных. Базу с данными надо хранить в соответствующей базе, а не прикрывать отличными инструментами недостатки в изначальном проектировании.

Ответить | Правка | Наверх | Cообщить модератору

88. "Релиз языка программирования GNU Awk 4.1.0 "  +1 +/
Сообщение от Евгений (??), 12-Май-13, 22:58 
> Трудно говорить с человеком, который никого не слышит, кроме себя.

Как же как, я весь во внимании.
> Для работы с тестовыми файлами удобны инструменты для работы с текстовыми данными.

Истину говорите!
> Причем, главным будет _удобство_, а не скорость.

Я абсолютно о том же, хотя и скорость не помешала бы. Открою для Вас секрет, что sed, awk, grep (perl, как крупнокалиберная артиллерия) очень даже быстродейственны.
>Вы зря сюда C приплели. > Для C есть очень хорошие библиотеки для работы с текстовой информацией.

Ну и как "сбацать" однострочник на Си с такой библиотекой против авка, седа и грепа? Вы же правильно раньше подметили об удобстве. Кстати, выигрыш такого опуса на Сях, Джаве и пр. может быть даже и не замечен на каждодневных примерах. Проверено неоднократно.
> Просто в простейших случаях это как на ракете за хлебом слетать.

Вот-вот, я тоже про ракету :).

> 1. Вы даже не представляете как устроен лог в винде.
> 2. event viewer - это просто штатный просмоторщик быстро глянуть в лог
> с минимальными возможностями (cat - тоже убог ;) ). Для регулярной
> работы с логом есть куча инструментов,  в том числе ,
> из всего зоопарка скриптовых языков.

Так назовите их имена и заодно скриптовые языки, и чем они лучше, эффективнее sed, awk и awk?
> 3. У syslog даже на Linux  есть куча очень достойных альтернатив.

Да, rsyslog, но идея та же, кстати все продумано, в том числе ротация логов, а вот в Виндовс я слышал есть проблемы с этим.

> Линадминов тоже хватает, которые не знают даже, где логи лежат. Только зачем
> говорить о недоучках? Может будем ориентироваться просто на админов.

Зачем лукавить, или Вы вчера родились. Позвоните в МС-хелп, походите на виндо-форумы, в том числе официальные от МС. И найдите хотя бы один намек на логи. Где и когда у Вас спросят про логи?
К тому же если логи вообще ничего не значат, как этот "Windows has encountered a system error f3-f100-001". И что хотя бы одно МС-овксая или Тошибовская морда понятия не имеет, что эта шестнадцатеричная шифровка f3-f100-001 означает? Виндологика частенько остается энигмой. Почитайте, на интернетах довольно много по этому поводу материала накопилось.

> Для xml, html, LaTeX как и других языков разметки (и, например, парсинга
> исходных текстов языков программирования) надо пользоваться соответствующими парсерами.

Назовите имена пожалуйста и явки. Во-первых, я опять имел в виду для себя. Вот Вам надо дампнуть страничку с какого-нибудь url, парснуть содержимое, что-то посчитать или найти, составить репорт и всё это не интерактивно и в большом объеме. Ваши предложения по специализированному парсеру? Чем однострочный парсинг на универсальных авке, грепе, седе или перле хуже специальных парсингеров? Кстати, Вас можно крыть Вашей же картой, каждый раз возражая, что данный парсер не достаточно универсальный.

> Парсить гигабайты xml на sed или ручками в Emacs будет только сильно  ограниченный в знаниях человек.

Да куда же нам до интеллектуалов от Венды :) Емаксом и каждая домохозяйка разберется, а вот Visual Basic - это самое то, рокет саенс!
>XML через регэкспы в общем случае вообще  не парсится.

То есть у Вас не получалось, вот и Ваш вывод. На мой взгляд, Ваши знания регексов в общем случае ограничены.

> Откройте для себя кроме Emacs огромный мир unix утилит и языков.  

Минуточку, открыть я для себя многое открыл, может еще и до Вашего рождения. Я к тому, что В Емаксе через Shell-command-on-region (M-|) с ненулевыми аргументами ЛЮБАЯ шелловская утилита очень хорошо интегрируется в Емаксе. Слыхали про IDE? Что же теперь Вижуал Студио тоже запретить?
> Перестаньте делать руками то, что должен делать компьютер.

А лучше купите у Майкрософта с еще какой-нибудь утилитой на .НЕТ на 10 ГБ, которые всё это профессионально будет делать? Слышу как Майкрософт стучит в Вашем сердце ;)
> Не надо уподобляться  начинающим пользователям виндов, которые все тащат в MS Word т.к. там
> им привычно работать на макросах VB.

Да Емакс -- это такой МС Ворд. Вы меня так рассмешили. А CAS (computer algebra systems)  - это такой ексель.  Хотя, если в Ворде (екселе) есть calc или dc, maxima, pari-gp  может и я буду всё в Ворд тащить  ("Унижусь до смиренной прозы", как сказал классик) :)
> Нет. Просто Вам говорят, что хватит петь аллилую текстовым логам с кашей
> в виде данных. Базу с данными надо хранить в соответствующей базе,
> а не прикрывать отличными инструментами недостатки в изначальном проектировании.

О недостатках проектирования, это Вы конечно в точку. Только вот, не по адресу. Вот например, Юникс "спроектирован" изначально не устраивать хаоса в директориях. Так, конфиги, бинарники, юзеровские документы и системные файлы никогда не пихаются в одну директорию, в отличие от.

Ответить | Правка | Наверх | Cообщить модератору

48. "Релиз языка программирования GNU Awk 4.1.0 "  +1 +/
Сообщение от arisu (ok), 12-Май-13, 02:42 
> Альтернатива — не придумывать лишние things, чтобы не пришлось их делать. Неужели
> это так сложно?

действительно, это просто. поэтому всякие sqlite и прочие «лишние things» приживаются очень хреново.

Ответить | Правка | К родителю #19 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру