The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Релиз YAGF 0.8.7, графической оболочки для систем распознавания текста

29.08.2011 14:21

Вышла новая версия YAGF, написанной с использованием Qt 4 графической оболочки для программ оптического распознавания текста Cuneiform и Tesseract. Программа позволяет через единый GUI-интерфейс управлять сканированием изображений, их предварительной обработкой и распознаванием большого числа отсканированных страниц.

Главными новшествами новой версии YAGF является возможность импорта страниц из формата PDF и поддержка системы распознавания текста Tesseract. Проект Tesseract изначально разрабатывался в 1985-1995 годы в лаборатории компании Hewlett Packard, в 2005 году код был открыт под лицензией Apache и в дальнейшем развивался при участии работников компании Google. Как и Cuneiform, система Tesseract поддерживает распознавание текста на русском и украинском языках.



  1. Главная ссылка к новости (http://symmetrica.net/cuneifor...)
  2. OpenNews: Релиз системы распознавания текстов Cuneiform 1.1.0
  3. OpenNews: Первый стабильный релиз системы распознавания текстов Cuneiform 1.0
  4. OpenNews: OCRFeeder 0.7.1a - новая версия графической оболочки для OCR-программ
  5. OpenNews: Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка
Автор новости: Андрей Боровский
Тип: Программы
Короткая ссылка: https://opennet.ru/31617-ocr
Ключевые слова: ocr, tesseract, YAGF, cuneiform
При перепечатке указание ссылки на opennet.ru обязательно
Обсуждение (13) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 15:49, 29/08/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    ктонть пробовал? насколько оно по сравнению с файнридером?
     
     
  • 2.3, luckym (ok), 15:59, 29/08/2011 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Ну разве что форматирование не поддерживает, а сам текст распознаёт нормально. Но это иногда только +, т.к. после ФайнРидера нередко приходилось всё форматирование сносить и заново форматировать.
     

  • 1.4, jedie (?), 16:03, 29/08/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Собрал, не работает!

    Ни ошибок, ничего. Тупо стоит ничего не делает.

     
     
  • 2.5, jedie (?), 16:04, 29/08/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Пробовал вот эту картинку:
    http://www.cs.uregina.ca/Links/class-info/425/Lab4/Picts/enhance_text.jpg
     
     
  • 3.9, NavDotRu (?), 17:13, 29/08/2011 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А сами распознаватели то установлены?
     
     
  • 4.11, anonymous (??), 21:20, 29/08/2011 [^] [^^] [^^^] [ответить]  
  • –1 +/
    > А сами распознаватели то установлены?

    нет, инфа 100%

     
  • 3.12, CityAceE (?), 01:17, 30/08/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Вот распознанный этим пакетом текст с этой картинки:

    Segmentation of nontrivial images is one of the mo~ processing. Segmentation accuracy determines the ev of computerized analysis procedures. For this reason, c be taken to improve the probability of rugged segment; such as industrial inspection applications, at least some the environment is possible at times. The experienced i designer invariably pays considerable attention to sucl

     

  • 1.6, Skull (ok), 16:12, 29/08/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Пакет уже собран в ALT Linux. Всё работает.
     
     
  • 2.10, ы (?), 20:05, 29/08/2011 [^] [^^] [^^^] [ответить]  
  • +/
    А в сизифе нету еще :(
     

  • 1.7, Аноним (-), 16:37, 29/08/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Отличная вещь для распознавания каптч.
     
     
  • 2.13, ФФ (ok), 09:29, 30/08/2011 [^] [^^] [^^^] [ответить]  
  • +/
    А зачем?
     

  • 1.14, Аноним (-), 21:49, 30/08/2011 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Как хорошо, что появилась эта морда к утилиткам... FineReaderокапец близок!
     
     
  • 2.15, Heckfy (ok), 13:57, 31/08/2011 [^] [^^] [^^^] [ответить]  
  • +/
    Еще не близок, но направление движения выбрано правильное.

    Жаль, еще нет веб2.0 интерфейса.
    Можно было бы в облаке хранить тысячи, десятки тысяч сканов, создаваемых с десятков-сотен сканнеров. Всё это в фоне преварительно анализировалось бы и менеджеры просматривали одну за другой сотни листов, поправляя направление сканирования и автоматические границы блоков.

     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Спонсоры:
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2020 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру