The OpenNET Project / Index page

[ новости /+++ | форум | теги | ]

форумы  помощь  поиск  регистрация  майллист  вход/выход  слежка  RSS
"Раздел полезных советов: Преобразование CHM в PDF"
Вариант для распечатки  
Пред. тема | След. тема 
Форум Разговоры, обсуждение новостей
Изначальное сообщение [ Отслеживать ]

"Раздел полезных советов: Преобразование CHM в PDF"  +/
Сообщение от auto_tips on 28-Янв-11, 08:37 
Для преобразования формата CHM в PDF существует утилита chm2pdf, написанная на языке Python.
Если Python нет, можно пойти в обход:

1. Нам нужна библиотека chmlib, в популярных дистрибутивах она есть.

2. Так же, нужна утилита extract_chmLib, находиться в пакете, где-то в chmlib-examples, где-то в chmlib-bin.

3. Утилита htmldoc,так же везде есть.

4. И объект испытаний, например RHCE.chm

Кстати, для chm2pdf так же нужна chmlib, Python и дополнительная библиотека на питоне.

И так, делаем два каталога:

   mkdir /tmp/CHM/PDF /tmp/CHM/HTML;

и переходим в первый

   сd /tmp/CHM

Извлекаем html страницы в каталог HTML

   extract_chmLib RHCE.chm ./HTML

В каталоге HTML обнаруживаем следующие файлы:

   18196.hhc
   $FIftiMain
   final
   #IDXHDR
   #ITBITS
   $OBJINST
   #STRINGS
   #SYSTEM
   #TOPICS
   #URLSTR
   #URLTBL
   #WINDOWS
   $WWAssociativeLinks
   $WWKeywordLinks

Кто что значит, рассказывать не буду, смотрите Википедию и MSDN.
Нас интересует каталог ./final/, именно в нем находятся все страницы с текстом и картинки, если они были в книге.

Этот каталог и станет исходным для формирования PDF, который мы передадим в качестве параметра в утилиту htmldoc.
Авторы рекомендуют делать два прохода при конвертации.

Первый - индексация, сортировка, удаление лишних элементов и объединение в один каталог.

   htmldoc -d PDF/ HTML/final/*.html

И второй - сама конвертация, но уже из каталога PDF:

   htmldoc --compression=9 --book --size a4 --jpeg=100 -t pdf14 -f RHCE.pdf PDF/*.html

html --help для краткой справки
man htmldoc - для более подробного описания параметров.

В итоге получился правильный формат книги и на 2 мегабайта меньше размер.


URL: http://pavlinux.ru/2011/01/27/110
Обсуждается: https://www.opennet.ru/tips/info/2525.shtml

Ответить | Правка | Cообщить модератору

Оглавление

Сообщения по теме [Сортировка по ответам | RSS]

1. "Преобразование CHM в PDF"  +/
Сообщение от AHAH on 28-Янв-11, 08:37 
на сколько помню 7зип умеет распаковывать цшм , на счет порта п7зип-фул не уверен =)
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

2. "Преобразование CHM в PDF"  +/
Сообщение от gegMOPO4 (ok) on 28-Янв-11, 17:31 
И "жёсткий" немасштабируемый формат.

Если волнует размер -- запакуйте вытащенные html в tar.xz, ещё меньше будет.

Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

3. "Преобразование CHM в PDF"  +/
Сообщение от Слакварявод on 28-Янв-11, 18:21 
тока сёдня ковырялся... вот.. в помощь многим...
http://lists.slackbuilds.org/pipermail/slackbuilds-users/200...
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

4. "Преобразование CHM в PDF"  +/
Сообщение от x0r (??) on 29-Янв-11, 00:30 
а как с русскими кодировками?
все нормально?
Ответить | Правка | ^ к родителю #0 | Наверх | Cообщить модератору

5. "Преобразование CHM в PDF"  +/
Сообщение от pavlinux (ok) on 29-Янв-11, 18:34 
Электронные книги понимают html.tar.xz ? :)
Ответить | Правка | ^ к родителю #2 | Наверх | Cообщить модератору

6. "Преобразование CHM в PDF"  +/
Сообщение от gegMOPO4 (ok) on 30-Янв-11, 20:04 
Не понял.
Ответить | Правка | ^ к родителю #5 | Наверх | Cообщить модератору

7. "Преобразование CHM в PDF"  +/
Сообщение от pavlinux (ok) on 30-Янв-11, 23:07 
> Не понял.

https://www.amazon.com/kindle

Ответить | Правка | ^ к родителю #6 | Наверх | Cообщить модератору

8. "Преобразование CHM в PDF"  +/
Сообщение от gegMOPO4 (ok) on 31-Янв-11, 00:30 
А-а-а... Не знаю, какой там софт и что он принимает.
Ответить | Правка | ^ к родителю #7 | Наверх | Cообщить модератору

9. "Преобразование CHM в PDF"  +/
Сообщение от pavlinux (ok) on 31-Янв-11, 01:10 
> А-а-а... Не знаю, какой там софт и что он принимает.

Content Formats Supported:
Kindle (AZW), TXT, PDF, Audible (Audible Enhanced (AA, AAX)), MP3, unprotected MOBI,
PRC natively; HTML, DOC, JPEG, GIF, PNG, BMP through conversion.

Ответить | Правка | ^ к родителю #8 | Наверх | Cообщить модератору

10. "Преобразование CHM в PDF"  +/
Сообщение от Пользователь Debian on 01-Фев-11, 17:59 
Какой ужас.

Есть же PocketBook, который умеет CHM, FB2 и сбственно HTML (ну, кроме неудобных для чтения PDF, DjVu и остальной ерунды).

Ответить | Правка | ^ к родителю #9 | Наверх | Cообщить модератору

11. "Преобразование CHM в PDF"  +/
Сообщение от pavlinux (ok) on 01-Фев-11, 18:32 
> Какой ужас.
> Есть же PocketBook, который умеет CHM, FB2 и сбственно HTML (ну, кроме
> неудобных для чтения PDF, DjVu и остальной ерунды).

А для прослушивания RealAudio мне надо покупать Apple?!

Ответить | Правка | ^ к родителю #10 | Наверх | Cообщить модератору

12. "Преобразование CHM в PDF"  +/
Сообщение от Аноним (??) on 04-Фев-11, 04:12 
> А для прослушивания RealAudio мне надо покупать Apple?!

Если производитель Вашего компьютера запрещает Вам слушать RealAudio, то — да, можете купить :)

Ответить | Правка | ^ к родителю #11 | Наверх | Cообщить модератору


Архив | Удалить

Рекомендовать для помещения в FAQ | Индекс форумов | Темы | Пред. тема | След. тема




Партнёры:
PostgresPro
Inferno Solutions
Hosting by Hoster.ru
Хостинг:

Закладки на сайте
Проследить за страницей
Created 1996-2024 by Maxim Chirkov
Добавить, Поддержать, Вебмастеру