The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

Новая версия оболочки для распознавания текста YAGF 0.9.3

19.02.2014 21:10

Вышла новая версия YAGF, написанной с использованием Qt 4 графической оболочки для программ оптического распознавания текста Cuneiform и Tesseract. Программа позволяет через единый GUI-интерфейс управлять сканированием изображений, их предварительной обработкой и распознаванием большого числа отсканированных страниц. Главным новшеством выпуска является улучшенное качество распознавания плохо отсканированных страниц



  1. Главная ссылка к новости (http://symmetrica.net/cuneifor...)
  2. OpenNews: Проект по созданию открытого робота-сканера для оцифровки документов
  3. OpenNews: Релиз системы распознавания текста Tesseract 3.0 с поддержкой русского языка
  4. OpenNews: Релиз YAGF 0.8.9, графической оболочки для систем распознавания текста
  5. OpenNews: Релиз системы распознавания текстов Cuneiform 1.1.0
Автор новости: Андрей Боровский
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/39130-yagf
Ключевые слова: yagf, ocr, cuneiform, tesseract
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (30) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Аноним (-), 21:46, 19/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • –5 +/
    Хммм... лучше пусть улучшат качество распознавания хорошо отсканированных страниц...
     
     
  • 2.2, Аноним (-), 22:25, 19/02/2014 [^] [^^] [^^^] [ответить]  
  • +7 +/
    Что мешает примкнуть к проектам Tesseract или Cuneiform?
     
     
  • 3.4, Карбофос (ok), 22:35, 19/02/2014 [^] [^^] [^^^] [ответить]  
  • +7 +/
    что мешает? демагогия и мешает. ибо нельзя разводить одновременно трёп о том, что лучше и что хуже, и что-то  действительно делать. тут одно из двух.
     
  • 3.8, Аноним (-), 01:02, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Им там жарко не станет если все недовольные юзеры интернета к ним "примкнут"?
    Че им там кофе носить или машину мыть? Думаешь на качество продукта это повлияет?
     
     
  • 4.12, name (??), 06:53, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Можно просто денег дать.
     
  • 4.20, Аноним (-), 10:35, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Если примкнуть в виде разработчика и выдавать кодом, то жарко не станет. Опыт показывает, что для OpenSource проекта соотношение пользователей к разработчикам редко превышает 1 к 10000, если только этот проект не предназначен только для разработчиков.
     
  • 2.3, RedCow (?), 22:29, 19/02/2014 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Неистово плюсую !!!
     

  • 1.5, paulus (ok), 23:37, 19/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    YAGF просто гуйня, вся проблема в пока еще плохом качестве распознавания текста  Cuneiform и Tesseract. Ждемсъ улучшений.
     
     
  • 2.9, Аноним (-), 02:58, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Откройте для себя scantailor.
     
     
  • 3.10, Аноним 2.0 (?), 03:24, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    А в нем возможно перспективу (трапецию) править?
    Я не нашел.
     

  • 1.7, Аноним (-), 00:46, 20/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    С распознаванием русского у неё до сих пор проблемы?
     
  • 1.11, Аноним (-), 04:31, 20/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    В сусе валится при импорте чего угодно.
     
  • 1.13, CHERTS (??), 07:13, 20/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Cuneiform и Tesseract очень даже неплохо распознают русский язык. Я уже 2-й месяц пишу библиотеку с использованием Tesseract и очень доволен качеством распознавания русского.
     
  • 1.14, Аноним (-), 08:51, 20/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    я поработал с тессерактом
    нужно было составить алгоритм распознавания чеков
    у тессеракта есть алгоритм самообучения
    но в целом он работает на слабую троечку

     
     
  • 2.15, Аноним (-), 09:32, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    На чём в итоге остановились?
     

  • 1.16, Аноним (-), 09:37, 20/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    жаль ни одна система распознования не умеет форматированный текст и таблицы.
     
     
  • 2.17, Аноним (-), 09:39, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Приходилось бесплатный cuneiform запускать в wine. Но он там очень плохо работает.
     
     
  • 3.18, Аноним (-), 09:49, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Чисто из любопытства, а зачем через вайн?
     
     
  • 4.26, Аноним (-), 21:15, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Бесплатная версия для виндовс умеет таблицы, картинки, форматированный текст и распознавать где картинка, где текст, где таблица.
    та что свободная не умеет всего этого.
     
  • 3.22, цирроз (ok), 10:51, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    этот проект уже несколько лет, как открыт. для линукса есть нативная версия, причем - во многих дистрибутивах
     

  • 1.19, Skull (ok), 10:08, 20/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Увы, эту версию надо допиливать (что усложняет контрибьютинг, так как автор использует для VCS svn, а не git):
    1. Выбор русского-английского языка при распознавании через Cuneiform приводит к ошибке, хотя ruseng в доступных словарях есть и в ошибке показывается.
    2. UI Language (и пункт и диалог), а также некоторые диалоги сообщения об ошибках не переведены.
    3. Зря автор сделал аляповатый диалог выбора языка распознавания.
    4. При попытке распознавания не может открыть input.bmp (собственно, это основная причина, по которой версия неработоспособна).
    5. При смене движка на tesseract (при наличии rus.traineddata) и оставшемся варианте «Русский» в выпадающем списке панели инструментов, пытается открыть английский словарь (выбраны языки русский и английский). Диалог явно лишний.

    Автору терпения и удачи!

     
     
  • 2.21, цирроз (ok), 10:45, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    пишите отчеты об ошибках на страничке проекта, тогда и софт будет лучше ;)
     
     
  • 3.28, Skull (ok), 13:21, 21/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > пишите отчеты об ошибках на страничке проекта, тогда и софт будет лучше ;)

    Форму ввода на официальной страничке покажите, дорогой Капитан Очевидность. :)

     
     
  • 4.30, цирроз (ok), 16:12, 21/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    вот, на проектной страничке
    https://code.google.com/p/yagf/issues/list
     
  • 2.23, ццц (?), 16:27, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Андрей, а что в альте OCRFeeder? Там язык можно для движков выбирать?
     
     
  • 3.29, Skull (ok), 13:28, 21/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    > Андрей, а что в альте OCRFeeder? Там язык можно для движков выбирать?

    Да, конечно.

    P.S. У нас там суровые патчи george@ (http://packages.altlinux.org/en/Sisyphus/srpms/ocrfeeder/patches). Надо будет посмотреть, что в новой версии, может, там и приложены.


     
  • 2.25, Андрей Боровский (?), 20:56, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +1 +/
    Большая часть претензий вращается вокруг английского словаря по умолчанию (исправлено) и работы с форматом TIFF. Запощу сюда еще это: http://quickgeeknotes.blogspot.ru/2014/02/yagf.html

    > Автору терпения и удачи!

    Спасибо!

     

  • 1.24, Аноним (-), 20:46, 20/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Кто может писать программы - пишет. Кто не может - учит писать программы. К сожалению, у этого правила нет исключения.
     
     
  • 2.27, Аноним (-), 21:19, 20/02/2014 [^] [^^] [^^^] [ответить]  
  • +/
    Как же нет? Думается мне большая часть не умеет и не учит.
     

  • 1.31, trdm (ok), 16:21, 22/02/2014 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    это только для линукса?
    А для винды будет сборка?
     

     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру