> но вопрос как дальше разбирать кириллицу?
> sed, tr как то не очень ее обрабатывают..Возьми те, которые умеют.
$ lynx -dump -nolist 106820+022-1.htm | tee >(wc -l >&2) |grep 'лицензи[юеяю]'
распространяется под лицензией GPL.
>Код Ardour распространяется под лицензией GPL
нарушают лицензию GPL. Бинарник платный только из официального
425
$ lynx -dump -nolist 106820+022-1.htm | tee >(wc -w >&2) |egrep -ci '\<[а-я]+\>'
1801
239
$ lynx -dump -nolist 106820+022-1.htm | tee >(wc -w >&2) |egrep -ci '\<[а-яА-Я]+\>'
1801
239
$ lynx -dump -nolist 106820+022-1.htm |sed -nr 's/(лицензи)[юея]/\1Я!/p'
распространяется под лицензиЯ!й GPL.
>Код Ardour распространяется под лицензиЯ!й GPL
нарушают лицензиЯ! GPL. Бинарник платный только из официального
$ lynx -dump -nolist 106820+022-1.htm |grep 'лицензи[юея]' |tr е Я
распространяЯтся под лицЯнзиЯй GPL.
>Код Ardour распространяЯтся под лицЯнзиЯй GPL
нарушают лицЯнзию GPL. Бинарник платный только из официального
> например, надо разобрать на слова, а все остальное удалить, включая пустые строки.
Тебе решение или совет?...