Конвертор epub ->pdf (перспективы, вопросы, пожелания)
Goto page 1, 2, 3, 4, 5  Next
 
Libroom Forum IndexПрограммное обеспечение
AuthorMessage

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 08.09.2010 23:14    

В связи с появлением Kindle 3 возникла необходимость в сохранении пользовательских шрифтов при чтении книг, изначально опубликованных в epub.
Mobi не позволяет внедрять пользовательские шрифты, поэтому пользователь обречен на чтение с глобальными шрифтами.
Для книг, изначально сделанных в fb2, этой проблемы нет, потому что существует превосходный конвертор fb2pdf (автор viktorz). К сожалению, такого же превосходного конвертора для epub пока не существует. Попытки конвертации epub в fb2 с последующим преобразованием в pdf через fb2pdf ни к чему хорошему не приводят.

Хороший конвертор epub2pdf прежде всего нужен для иностранных книг, которые публикуются в форматах, отличных от fb2. Почти все эти форматы могут быть приведены к epub.
Такой конвертор может представлять интерес и для русскоязычных пользователей, потому что новые ридеры от Sony и Amazon могут стимулировать создание книг на русском языке в формате epub и mobi.

На сегодняшний день мне известны следующие конверторы epub->pdf:
epub2pdf, написан на Java
Скрипт на Python

Я опробовал первый конвертор на Windows 7 и выяснил, что он работает, но обладает следующими недостатками: медленный, не выравнивает по правому краю (хоть и имеет соответствующую опцию), не вставляет гиперссылки.
Второй конвертор мне не удалось запустить, потому что автор отладил его на Linux только и проблемы Windows его не интересуют.
Правда, viktorz смог его запустить, но выяснилось, что конвертор хоть и вставляет ссылки в pdf, но при этом портит их.

victorz

Вы сообщали, что Вам удалось запустить это скрипт под Windows. У меня прежде всего питон говорит:
"NameError: global name 'unicode' is not defined"
О питоне у меня нет знаний, только ощущения в части схожести с C++, так что все мои попытки добавки #include и путей в Path ни к чему не привели.
Не поможете ли?
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 08.09.2010 23:42    

Что конкретно у Вас с питоном не так, мне сказать трудно не глядя. Но я могу описать, что я сделал.

1. Поставил Python 2.7. Обратите внимание на версию - это последняя версия в линейке 2.х, но существует еще и новая линейка 3.х. Обратной совместимости нет, что работало с 2.х может не работать с 3.х. Так что ставьте, как у меня - 2.7, с ним точно работает.

2. Поставил PyQt4. Опять же обратите внимание, инсталяторы для виндовс разные для разных питонов, Вам, естественно, нужен для 2.7

3. Поставил Prince XML 7.1.

4. Исправил ошибки в скрипте - ищите мой аттачмент тут http://www.mobileread.com/forums/showthread.php?t=89689
Да, и путь к Prince XML прямо в скрипт запихал, у меня это C:\\Program Files\\Prince\\Engine\\bin\\prince.exe

5. Скопировал пару файлов из PyQt туда, где скрипт лежит. По-хорошему надо пути как-то настроить, но мне было лень:
C:\Python27\Lib\site-packages\PyQt4\bin\QtGui4.dll
C:\Python27\Lib\site-packages\PyQt4\bin\QtCore4.dll


Вроде все. При запуске показывает GUI, файлы конвертит симпатично, можно свой CSS подсунуть. Тока ссылки ломает.
_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 09.09.2010 00:43    

Спасибо!
Я, конечно же, ставил Python 3.1.
Кстати, нужно обязательно перезагрузиться после всех установок.
Да, ссылки сломаны и номера страниц насильно ставит.
А вот насчет своего CSS - редактировать скрипт или класть в каталог скрипта?
И самое главное, куда девать свои шрифты - в тот же каталог?

Posted after 22 minutes 42 seconds:

Нужно загрузить свой css через Add dss и положить файл шрифта в каталог скрипта.
И шрифт называть в css его полным именем, а не именем файла.
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 09.09.2010 01:42    

knigophil wrote:
номера страниц насильно ставит.

Не насильно ставит, а в дефолтовом css прописано. Можно поменять. Prince, кстати, имеет документацию: http://www.princexml.com/doc/7.0/

Posted after 9 minutes 8 seconds:

knigophil wrote:
положить файл шрифта в каталог скрипта


Да вроде у меня и так шрифт находило, который в винде как положено инсталлирован, к примеру вот так находит, в директории скрипта его нету:

Code:
@font-face {
    font-family: serif;
    src: local("Georgia")
}

_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 09.09.2010 04:37    

И еще уважает встроенные шрифты в epub и переносит их в pdf, что иногда хорошо, а иногда нет.

Posted after 4 minutes 11 seconds:

А насчет линков на временные файлы - мне кажется, что это старая болезнь Prince, когда он не мог разрешить ссылки при нескольких входных файлах. Об этом давно писали на их форуме здесь
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 09.09.2010 05:12    

knigophil wrote:
И еще уважает встроенные шрифты в epub и переносит их в pdf, что иногда хорошо, а иногда нет.


Он уважает, но если это мешает, то внутренние стили можно перекрыть своими.
_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 09.09.2010 07:58    

Подстроил все, что хотел. Одно не понимаю: казалось бы, внешний css должен первенствовать по отношению к css по умолчанию, находящемуся в скрипте. Тем не менее, я замучался устанавливать два параметра: размер страницы и размер шрифта. Что бы ни делал во внешнем css c этими параметрами, ничего не менялось, это size в теге page и fontsize в теге body. Заменил их во внутреннем css и все пошло при подключенном внешнем dss. Все остальные параметры - шрифт, поля, межстрочный интервал заданы во внешнем css и работают.
Странно, однако.
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 09.09.2010 08:33    

А используете ли Вы во внешнем css "!important"? Например:

Code:
body {
  font-size: 24.0pt !important;
}

помогает...


http://www.w3.org/TR/CSS2/cascade.html#important-rules

Posted after 17 minutes 23 seconds:

knigophil wrote:

А насчет линков на временные файлы - мне кажется, что это старая болезнь Prince, когда он не мог разрешить ссылки при нескольких входных файлах. Об этом давно писали на их форуме здесь


Похоже, эта старая проблема все еще в списке TODO:
http://www.princexml.com/roadmap wrote:
Fix bug where internal links to empty anchor elements don't always work.

_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 09.09.2010 09:16    

viktorz wrote:
А используете ли Вы во внешнем css "!important"? Например:

Век живи, век учись... но дураком все равно... Smile
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 09.09.2010 09:26    

Ага, ну еще маленько подправив скрипт, я получил работающие ссылки - иногда. Зависит от книжки. Книжка с литреса, скачана в epub - ссылки не работают, она же скачана в fb2 и конвертирована в epub конвертером от sorotokin - ссылки работают. В литресовском варианте ссылки на пустой span, в соротокинском - ссылки на непустой div. Ну, авось prince xml починят когда-нибудь...

http://s3.amazonaws.com/viktorz/fb2pdf/epubutils_win.zip
_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 09.09.2010 22:07    

Замечательно!
Алиса в стране чудес и Через зеркало - обе книги-самоделки с mobileread - переходы по ссылкам работают.
Властелин колец, перевод Муравьева, изначально fb2, конвертирован локально fb2epub, бездна примечаний в конце книги и ссылок на них - работает туда и обратно.
Вопрос: а как пересилить встроенные шрифты? Я пока придумал только один способ, хирургический - насильственно удалить шрифты из файла.
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 09.09.2010 22:43    

knigophil wrote:
Вопрос: а как пересилить встроенные шрифты? Я пока придумал только один способ, хирургический - насильственно удалить шрифты из файла.


В каком смысле "пересилить"? Хотите свои шрифты в результирующем pdf? Так пропишите их в своем CSS. Только не забывайте во-первых, про !important, и во-вторых, про то, что разные элементы могут иметь собственные стили, так что установить шрифт только для body может быть недостаточно, мне, например, пришлось явно указать шрифты для p, div, h1, h2, h3 - и тогда встроенные шрифты совсем пропали, а остались только мной указанные
_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 10.09.2010 00:07    

Да, оказалось достаточно только прописать в p.

Posted after 7 minutes 3 seconds:

Жаль только, что Kindle 3 не заметит, как хорошо теперь конвертор расставляет ссылки - в сегодняшнем исполнении он по ссылкам в pdf не ходит. Надо надеяться, что исправят. Зато во всем остальном книгу можно теперь настроить по собственному вкусу, это важно.
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 10.09.2010 01:31    

knigophil wrote:
Жаль только, что Kindle 3 не заметит, как хорошо теперь конвертор расставляет ссылки - в сегодняшнем исполнении он по ссылкам в pdf не ходит.


А по содержанию (bookmarks в pdf) он как-то ходит? Например, для своей тестовой книжки я добавил в CSS вот такое:
Code:
div.title3 > p:first-of-type.title-p {
    prince-bookmark-level: 1;
}

div.title4 > p:first-of-type.title-p {
    prince-bookmark-level: 2;
}

и получил в результирующем pdf вот такое:



Так что если девайс позволяет удобно перемещаться по содержанию, как например PRS-505, то можно пережить и отсутствие переходов по ссылкам.
_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 10.09.2010 04:12    

Мой Kindle 3 еще не выехал.
Это я к нему все готовлюсь. Но уже ясно, что это, увы, не Sony.
А пока крик вот отсюда:
-------------
No support for PDF bookmarks

Here’s my biggest niggle with the Kindle, though, when using it to read PDF documents: it doesn’t appear to have support for PDF bookmarks. This seems to me to be a huge failing, as it is often the way that I navigate around large PDF documents when viewing them on my PC.
-------------
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 10.09.2010 21:13    

Некоторые наблюдения по поводу эффективности Вашего fb2pdf и Prince.
Властелин колец, пер. Каменковича (раннее я ошибочно полагал, что это Муравьев), 880 примечаний.
fb2 тут; epub, сделанный в fb2epub, здесь.
fb2pdf создает огромный файл 26 MB, Prince 11 MB.
Тем не менее, файл от fb2pdf прекрасно работает на Sony 900, весело ходит по ссылкам. Файл от Prince завешивает Сони даже на простом чтении, о переходах по ссылкам говорить не приходится - висит по десять минут.
Единственное, что смущает меня в файле от fb2pdf, это то, что как в Acrobat Reader, так и на Сони примечания в bookmarks не видны, в то время как в файле от Prince все 880 появляются. Я подозреваю, что дело тут в fb2epub, он почему-то примечания не включает в букмарки.
Еще, естественно, Prince не транслитерирует оглавление, что на моей нерусифицированной Соне есть недостаток, но несущественный.
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 10.09.2010 22:02    

knigophil wrote:
Файл от Prince завешивает Сони даже на простом чтении, о переходах по ссылкам говорить не приходится - висит по десять минут.


А он, надо полагать, нелинеаризован после Принца. Возможно, ему поможет линеаризация.

Posted after 2 minutes 39 seconds:

knigophil wrote:
Единственное, что смущает меня в файле от fb2pdf, это то, что как в Acrobat Reader, так и на Сони примечания в bookmarks не видны, в то время как в файле от Prince все 880 появляются. Я подозреваю, что дело тут в fb2epub, он почему-то примечания не включает в букмарки.

fb2pdf примечания не включает в bookmarks сознательно. Как-то до сих пор я полагал, что им там не место. Хотя убей, не помню, почему я так решил. Но определенно, они специально исключаются.
_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 10.09.2010 23:54    

viktorz wrote:
А он, надо полагать, нелинеаризован после Принца. Возможно, ему поможет линеаризация.


Их много, линеаризаторов. Какой порекомендуете?
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^

viktorz
Член клуба The eBook

Член клуба The eBook



Joined: 22 Sep 2007
Posts: 3209


Location: San Jose, CA

Posted: 11.09.2010 02:25    

knigophil wrote:
Их много, линеаризаторов. Какой порекомендуете?


Пользовался только тем, который в конвертор от KiR включен, это ghostscript. Про остальные ничего не знаю.
_________________
Nothing Is Ever Easy fb2pdf
 
View user's profile ^

knigophil
Член клуба The eBook

Член клуба The eBook



Joined: 24 May 2010
Posts: 2279


Location: SoCal

Posted: 11.09.2010 07:35    

Линеаризировал, запускал pdfopt.bat из последнего дистрибутива Ghostscript. Сони висел на открытии файла минут двадцать. Так что, видать, это 880 примечаний в букмарках тянут на дно... Smile
_________________
Kindle Voyage
Рекомендации по межформатному конвертированию
 
View user's profile ^
Libroom Forum IndexПрограммное обеспечениеAll times are GMT + 4 Hours
Goto page 1, 2, 3, 4, 5  Next
Page 1 of 5

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© Libroom, 2021