The OpenNET Project / Index page

[ новости /+++ | форум | wiki | теги | ]

Проект по созданию открытого робота-сканера для оцифровки документов

01.04.2012 12:38

В рамках проекта Gado предпринята попытка создания максимально открытого автономного архивного робота для сканирования и оцифровки книг, изображений и документов. Главная практическая цель, которую преследуют разработчики, это дать возможность небольшим архивам, музеям и библиотекам без покупки дорогостоящих систем автоматического сканирования, своими силами провести оцифровку материалов, дав вторую цифровую жизнь многим драгоценным документам и книгам уходящей эпохи. В настоящее время прототип открытого робота-сканера Gado уже задействован в проекте оцифровки изображений газеты Afro American.

Проект Gado основан в 2010 году и предполагает поэтапное развитие. В настоящее время завершена первая фаза проекта, в рамках которой был создан работающий прототип сканирующей машины. Сейчас в самом разгаре вторая стадия этого проекта, в рамках которой завершается создание Gado 2, отличиями которого является более высокая скорость сканирования, компактные размеры (в два раза меньше первого прототипа), общая простота эксплуатации (для работы не требуется никаких специальных навыков). Итоговая стоимость сканирующего устройства, которое предлагается собрать из широко распространённых недорогих компонентов, не должна превышать сумму в 500 долларов за экземпляр.

Аппаратная часть устройства базируется на открытом микроконтроллере Arduino. Управление производится с ПК на базе Ubuntu Linux. Все спецификации и схемы открыты и доступны для доработки и улучшения другими энтузиастами. В качестве движка для распознавания текста используется Tesseract OCR, для хранения метаданных и каталогизации введенных данных применяется база данных MySQL. Для реализации логики работы всей системы на прикладном уровне используется набор скриптов на языке Python, для оцифровки фотографий задействован пакет gPhoto, а для управление самим процессом сканирования - SANE.

Лидер проекта Томас Смит (Thomas Smith) подчеркивает, что использование открытых инструментов не только позволило удержать итоговую цену робота в пределах 500 долларов, что было очень важно для проекта, но также предоставило нужный уровень гибкости в доработке и адаптации каждой отдельной его составляющей при решении достаточно необычной задачи. Предварительный заказ сканера Gado 2 уже сейчас открыт через сайт Kickstarter. Финальная версия будет готова к поставкам ориентировочно в августе этого года.



  1. Главная ссылка к новости (https://www.linux.com/learn/tu...)
Автор новости: Igor Savchuk
Лицензия: CC BY 3.0
Короткая ссылка: https://opennet.ru/33500-gado
Ключевые слова: gado, arduino, robot, scanner, ocr
При перепечатке указание ссылки на opennet.ru обязательно


Обсуждение (29) Ajax | 1 уровень | Линейный | +/- | Раскрыть всё | RSS
  • 1.1, Вопрос (?), 13:56, 01/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +3 +/
    А он сможет приготовить мне кофе? Я люблю разные сорта, надо чтоб робот тщательно разбирался в приготовлении каждого.
     
     
  • 2.3, IdeaFix (?), 14:05, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Если оно не умеет эмулировать рассу (кошака, который жрет кофейные бобы а потом серит ферментированными зернушками), то игра не стоит свеч...
     
     
  • 3.4, Аноним (-), 14:12, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • –1 +/
    Че за xepню ты написал?
     
     
  • 4.5, stimpack (ok), 14:19, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    поищи процесс приготовления самого дорогого кофе на планете
     
     
  • 5.12, vlrv (ok), 17:52, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Слышал звон да не знаешь где он. Там не кошаки пропускают через себя зёрна.
     
     
  • 6.19, Онаним (?), 21:58, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Какая разница? Дерьмо есть дерьмо.
     

  • 1.2, abra (ok), 14:00, 01/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Skynet не за горами. Смерть человекам!
     
     
  • 2.10, Аноним (-), 15:55, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    Не волнуйся, ты ещё успеешь притормозить развитие человечества :)
     
  • 2.13, Аноним (-), 18:08, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    > Skynet не за горами. Смерть человекам!

    Ну наконец то кретинизм с патентами и прочей копирастией отпадет и здравый смысл победит. Роботам нет смысла заниматься такой фигней. А то что мы будем в роли динозавров - так может мы сами в этом и виноваты? :)

     
  • 2.20, Evtomax (ok), 23:58, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Осталось придумать портативный атомный реактор :)
     
     
  • 3.26, СуперАноним (?), 08:01, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    http://x-faq.ru/index.php?topic=919.0
     

  • 1.6, xxx (??), 14:28, 01/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +11 +/
    Нет. Нужен другой робот - человекоподобный, чтобы умело мимикрировал под хомосапиенс. Он будет ходить по книжным магазинам, библиотекам, быстренько сканировать глазами текст и выкладывать на рутрекер.
     
     
  • 2.7, Motif (ok), 14:59, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +2 +/
    +1000

    и на Флибусту тоже

     

  • 1.8, Ананимуз (?), 15:02, 01/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    Есть мнение, что книги таким способам сканировать проблематично.
    Более того, техника вроде как давно отработана:
    - раскрытая кладется на стол столе
    - манипулятор с таким же компрессором переворачивает страницы
    - книга прижимается стеклом
    - висящий сверху фотоаппарат делает снимок
    Места займет больше, да. Но "сканировать" можно и книги и документы (отдельные листы) и процесс гораздо быстрее.
     
     
  • 2.9, f (??), 15:36, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • –4 +/
    Гениально! Будешь главным механиком планеты?
     
  • 2.14, Аноним (-), 18:09, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > - висящий сверху фотоаппарат делает снимок

    Сканер дает куда как более хорошую картинку чем фотоаппарат сверху.

     
     
  • 3.17, Ананимуз (?), 19:02, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Видимо поэтому фото/видеокамеры и являются дежурным решением для коммерческих сканеров книг.

    Ну да, лист A4 отсканенный в 600dpi, это ~33 мегапикселя. Если оцифровываешь картины великих художников и хочешь уложиться в 500 баксов, то сканер наверное лучше. Главное запстись терпением и прижимать получше, а то глубина резкости у сканеров никакая.
    Но для оцифровки с целью распознавания текста, больше 300 dpi уже ничем не помогают. 300dpi, это 8.5 мегапикселей, т.е. уровень самых дешевых мыльниц. Для получения четкого снимка теста их более чем достаточно, причем некоторую неровность листа, в отличии от сканера, они даже не заметят.

     
     
  • 4.21, Evtomax (ok), 00:00, 02/04/2012 [^] [^^] [^^^] [ответить]  
  • +1 +/
    А вы знаете, что существует целых 2 типа сканеров, один из которых не имеет проблем с резкостью и может даже лицо чётко отсканировать? :)
     
     
  • 5.22, Ананимуз (?), 00:34, 02/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    > не имеет проблем с резкостью

    Да откуда мне такое знать? Но я с удовольствием послушаю как CCD-сканеры храбро сканируют лицо без мыла.

     

  • 1.11, light (??), 17:19, 01/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    газета, хоть и существует реально, приведена как поздравление с 1 апреля
     
  • 1.15, Аноним (-), 18:43, 01/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +1 +/
    За менее 500$ можно купить сканер с автоподачиком.
    Загружаем стопку документов и не нужен пылесос, криво бросающий листки.
     
     
  • 2.18, R (?), 19:27, 01/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Аноним (??) on 01-Апр-12, 18:43
    > За менее 500$ можно купить сканер с автоподачиком.
    > Загружаем стопку документов и не нужен пылесос, криво бросающий листки.

    Аноним (??) on 01-Апр-12, 18:51
    > Сканер в вертикальной загрузкой листов уже не устраивает?

    Ну что вы так сразу набросились? Здесь же ключевое слово "РОБОТ", а не сканер. Для обучения школьников основам робототехники очень даже подходит. (Правда, не сответствует заявленной направлености проекта).
    Cамодельных конструкций для сканирования обычных книг в сети тоже довольно много встечается. Например: http://www.rlocman.ru/shem/schematics.html?di=52697 Правда, никто не гарантирует, что после такого робота книгу сможет читать человек ;-)
    А вот по поводу старых раритетных книг и всяких подшивок, которые при сканировании важно сохранить в неповрежденном виде - дешево ну никак не получится. В специализированных сканерах для таких вещей даже всякие фильтры инфракрасного-ультрафиолетового предусмотрены, дабы не повредить раритет, не говоря уже о специальных приспособлениях для уменьшения угла раскрытия при сканировании (например, сканеры с очень маленькими полями).


     
  • 2.28, мазай (?), 13:23, 03/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    мыльницу можно использовать как сканер.
    А сканер с автоподатчиком как мыльницу использовать вряд ли получится.

    В общем вполне вариант для бедного студента, имеющего кучу времени, желания заняться фигней, а не переписыванием конспектов по пропущенным лекциям.

     

  • 1.16, Аноним (-), 18:51, 01/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Сканер в вертикальной загрузкой листов уже не устраивает?
     
  • 1.23, Piter_Ring (ok), 09:00, 02/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Сколько возни, а результата на копейку.
    Как это в стиле всего ФРИ....
    И за это еще 500 мертвых президентов? У вас там сОсны сильно-густо растут.
     
  • 1.24, Аноним (-), 11:13, 02/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    мдя, книгу таким не сосканишь, только пачку бумажек, которые можно и сканером с автоподатчиком сосканить...
     
  • 1.25, 40M (?), 17:43, 02/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Робот для оцифровки VHS & SVHS был бы очень кстати)
     
  • 1.27, Аноним (-), 08:13, 03/04/2012 [ответить] [﹢﹢﹢] [ · · · ]  
  • +/
    Прижимать книгу разворотом к сканеру... Это не подходит для старых ветхих книг.
     
     
  • 2.29, vlivyur (ok), 12:08, 05/04/2012 [^] [^^] [^^^] [ответить]  
  • +/
    Так вроде делают полураскрытую книжку (градусов под 90) и два фотоаппарата на обе страницы.
     
     Добавить комментарий
    Имя:
    E-Mail:
    Текст:



    Партнёры:
    PostgresPro
    Inferno Solutions
    Hosting by Hoster.ru
    Хостинг:

    Закладки на сайте
    Проследить за страницей
    Created 1996-2024 by Maxim Chirkov
    Добавить, Поддержать, Вебмастеру