The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]



"Техника скрытия данных в тексте через манипуляцию c глифами ..."
Версия для распечатки Пред. тема | След. тема
Форум Разговоры, обсуждение новостей
Исходное сообщение [ Отслеживать ]
Заметили полезную информацию ? Пожалуйста добавьте в FAQ на WIKI.
. "Техника скрытия данных в тексте через манипуляцию c глифами ..." +/
Сообщение от Orduemail (ok), 27-Май-18, 16:16 
> Какому стгашному перату сильно надо будет - он документ отOCRит, а на свой пераццкий сайт выложит результат.

OCR на сегодня -- это сложный процесс, требующий нескольких часов как минимум. Это если не выверять грамматику и мелочи типа использования различных шрифтов и их начертаний, если озаботиться только тем, чтобы правильно нарисовать в результирующем файле формулы, таблички, диаграммки, схемы, прочие изображения. При этом, кстати, полностью теряется информация о номерах страниц, что иногда делает эту пераццкую версию совершенно бесполезной: мне может хочется процитировать источник и указать цитату с номером страницы, как это делать, если источник не содержит номеров страниц?

Все эти сложности с OCR приводят к тому, что самым удачным способом создания пераццкой версии является pdf'ка, в которой есть сканы страниц с наложенным поверх слоем распознанного текста (для того, чтобы можно было бы копипастить текст и искать по тексту).

Ответить | Правка | Наверх | Cообщить модератору

Оглавление
Техника скрытия данных в тексте через манипуляцию c глифами ..., opennews, 27-Май-18, 09:53  [смотреть все]
Форумы | Темы | Пред. тема | След. тема



Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру