The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Выпуск системы распознавания текста GNU Ocrad 0.23"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от opennews (ok) on 24-Мрт-14, 22:31 
Представлен (http://permalink.gmane.org/gmane.org.fsf.announce/2123) релиз системы распознавания текста Ocrad (http://www.gnu.org/software/ocrad/ocrad.html) (Optical Character Recognition) 0.23, развиваемой под эгидой проекта GNU. Из изменений в новой версии отмечено улучшение распознавание символов (например, более корректное разделение схожих начертаний L и Z) и реализация удаления лидирующих пробелов в фильтрах "только буквы" и "только цифры".


Для оптического распознавания в Ocrad используется метод выделение признаков (feature extraction (http://en.wikipedia.org/wiki/Feature_extraction)).  Ocrad может применяться как в форме библиотеки для интеграции функций OCR в другие приложения, так и в форме обособленной утилиты, которая на основе переданного на вход изображения выдаёт текст в UTF-8 или 8-битных кодировках. Распознавание поддерживается только для  кодировок "ascii", "iso-8859-9" и "iso-8859-15". Поддержка кириллицы отсутствует. В состав входит анализатор макета страницы, позволяющий корректно разделять столбцы и блоки текста в печатных документах.


URL: http://permalink.gmane.org/gmane.org.fsf.announce/2123
Новость: http://www.opennet.ru/opennews/art.shtml?num=39392

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по времени | RSS]


1. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от qwewewewewep (ok) on 24-Мрт-14, 22:31 
интересно как оно по сравнению с ocropus, tesseract ?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

5. "Выпуск системы распознавания текста GNU Ocrad 0.23"  –4 +/
Сообщение от Аноним (??) on 24-Мрт-14, 23:11 
FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится радоваться подобным новостям.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

8. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +6 +/
Сообщение от A.Stahl (ok) on 25-Мрт-14, 00:11 
>FineRider

Неужели Офигенный Всадник лучше расшифровывает свитки, чем Джо Мокрый Нос Длинная Сопля?
>что даже не приходится радоваться подобным новостям.

Какая разница что может какая-то другая программа?
То, что fineReader лучше, не делает Ocrad хуже.
То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.
Вышла новая версия. Улучшенная версия. Чем не повод порадоваться?
Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.
Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
Так устроен мир.

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

9. "Выпуск системы распознавания текста GNU Ocrad 0.23"  –1 +/
Сообщение от Аноним (??) on 25-Мрт-14, 00:24 
Оно путало L и Z. Лично мне хочется плакать, а не радоваться.
Оно на стадии "ребенок учится ползать", в то время как какие-то движки из первого комментария открыты и умеют что-то распознавать на среднем уровне. Накой этот велосипед?
Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

10. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Аноним (??) on 25-Мрт-14, 01:29 
Что бы ты плакал.
Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

14. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Евгений (??) on 25-Мрт-14, 05:37 
> Оно путало L и Z. Лично мне хочется плакать, а не радоваться.

Никто ничего не путал, уважаемому не стоит беспокоится
> Оно на стадии "ребенок учится ползать", в то время как какие-то движки
> из первого комментария открыты и умеют что-то распознавать на среднем уровне.
> Накой этот велосипед?

Основные проблемы у меня последний раз были в смешанном тексте с кириллицей и латиницей. Года 3 назад с  tesseract-ocr.

Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

19. "Выпуск системы распознавания текста GNU Ocrad 0.23"  –1 +/
Сообщение от Аноним (??) on 25-Мрт-14, 12:55 
> То, что в openSource сообществе нет специалистов по распознаванию никак не дискредитирует систему.

Там так же нет и многих других специалистов. И в конце-концов этот снежный ком недовидео-недоаудио-недофото и прочих просто-нету таки дискредитирует систему.

> Нельзя проскочить промежуточные этапы. Нельзя от палки-копалки перейти к транзисторам.

Придётся сначала и с зубчатыми колёсами и с катушками и с лампами повозиться.
Так устроен мир.

Так устроен опенсорс, где эти этапы за такое количество лет так и не были пройдены.

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

18. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от IP (??) on 25-Мрт-14, 11:36 
> FineRider от всей этой опенсорсной лабуды так недосягаем, что даже не приходится
> радоваться подобным новостям.

Вот только версии под линукс нет как таковой, я бы купил для дома буде таковая продавалась.
Но таки ёк, только либа за штуку баксофф и "напиши гуй сам", при том, что хоум версия под винды меньше сотки.
Да, файнридер хорош в распознавании, вот только запускать крайне хлопотно, когда нет желания с виндой возиться.

Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

21. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от ваноним on 25-Мрт-14, 17:35 
> Вот только версии под линукс нет как таковой

Под Linux есть SDK: http://www.abbyy.com/ocr_sdk_linux/

Ответить | Правка | ^ к родителю #18 | Наверх | Cообщить модератору

7. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от paulus (ok) on 24-Мрт-14, 23:31 
cuneiform и tesseract нормально не работают, а про оcrad даже не стоит и заикаться. Хотя то, что работы в этих направлениях ведутся всеже плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

11. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Аноним (??) on 25-Мрт-14, 01:31 
> cuneiform и tesseract нормально не работают. Давно не пользовался, что сейчас из перечисленного более вменяемое?

Вот и проверьте, потом здесь расскажите.

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

12. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от 1 (??) on 25-Мрт-14, 01:41 
Проверил - лучше всех штука finereader online
Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору

13. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от VolanD (ok) on 25-Мрт-14, 05:02 
> Проверил - лучше всех штука finereader online

Ага, чтобы сразу в архивы АНБ?

Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

16. " Проверил - лучше всех штука finereader online"  +/
Сообщение от Аноним (??) on 25-Мрт-14, 08:59 
Вы сами-то пробовали on-line?
Там ограничение и на количество страниц и документов. Затем просит заплатить.
Ответить | Правка | ^ к родителю #12 | Наверх | Cообщить модератору

15. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Евгений (??) on 25-Мрт-14, 05:40 
> cuneiform и tesseract нормально не работают, а про оcrad даже не стоит
> и заикаться. Хотя то, что работы в этих направлениях ведутся всеже
> плюс. Давно не пользовался, что сейчас из перечисленного более вменяемое?

У меня проблемы были только со смешанным текстом  года 3 назад...

Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

24. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Например on 26-Мрт-14, 14:05 
что значит "нормально"? с формулами, таблицами есть проблемы, а обычный текст у меня хорошо распознавался.
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

17. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Аноним (??) on 25-Мрт-14, 09:49 
Только я один прочел вначале как orcad со всеми вытекающими? ))
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

20. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Аноним (??) on 25-Мрт-14, 16:38 
Так ведь есть же Cuneiform который русский поддерживает. Еще бы gui на gtk ему нормальное прикрутить.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

22. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Аноним (??) on 25-Мрт-14, 17:41 
Периодически юзаю синеформу для распознавания разных домашних бумажек в убунте 12.04 из терминала, меня устраивает. Точность распознавания процентов 80. Всё лучше чем руками перенабирать.
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

23. "Выпуск системы распознавания текста GNU Ocrad 0.23"  +/
Сообщение от Василий (??) on 25-Мрт-14, 18:14 
> Поддержка кириллицы отсутствует

Блин! С этого же надо было заметку начинать! А то я столько буковок прочитал зря, зачем напрягался? Минуты полторы убил зря! :-)))

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Спонсоры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2022 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру