Author | Message |
---|
SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 29.12.2010 11:49 | |
| Как известно, все аннотации (выделение, заметки, закладки), сделанные киндлом в pdf-файлах, хранятся рядом в файлах pdr, а также в текстовом виде заносятся в файл My Clippings. Было бы полезно иметь софтину, которая могла бы эти аннотации переносить оттуда в сам pdf-файл стандартными средствами аннотирования акробата, чтобы результаты работы с документом в киндле можно было потом хранить на компьютере неограниченное время. Кто-нибудь готовое решение уже встречал? Если нет, есть ли энтузиасты, готовые взяться за разработку? _________________ Kindle 3 White 3G, Nook Simple Touch |
| | | Levsha128 Зрелый участник форума
Joined: 24 Dec 2010 Posts: 30
Location: Kherson, Ukraine
| Posted: 29.12.2010 15:53 | |
| Если готовых программ нет, то могу попробовать написать, но гарантий не даю. Только пока киндла у меня еще нет, тестить не на чем =(
Кое что уже есть: http://www.angelfire.com/ego2/idleloop/mbp_reader.html но тут просто перегон в текстовый файл. upd: сори, протупил _________________ Kindle 3g
Last edited by Levsha128 on 29.12.2010 16:19; edited 1 time in total |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| | | | Levsha128 Зрелый участник форума
Joined: 24 Dec 2010 Posts: 30
Location: Kherson, Ukraine
| Posted: 29.12.2010 16:17 | |
| 2 SP777: Можешь скинуть файлик в этом формате, интересно поковыряться внутри. _________________ Kindle 3g |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 29.12.2010 16:51 | |
| Файлы здесь: http://www.ex.ua/view_storage/245295759869 ПДФ не исправлял, чтобы был нетронутый оригинал. Список аннотаций:
Code: | Закладки: - стр 3 - стр 6
Выделено маркером: - стр 4, весь второй абзац (со слов "In the general consumer markets") - стр 7, весь второй абзац (со слов "This Work Programme also includes")
Заметки: - стр 5, к словам "More intelligent" во втором абзаце, текст заметки "Test note 1" - стр 8, к словам "This will" в третьем абзаце, текст заметки "Test note 2"
|
_________________ Kindle 3 White 3G, Nook Simple Touch |
| | | Levsha128 Зрелый участник форума
Joined: 24 Dec 2010 Posts: 30
Location: Kherson, Ukraine
| Posted: 29.12.2010 17:32 | |
| Ага, спасибо, попробую разобраться.
Добавлено спустя 9 минут 1 секунду:
Так, .pdr формат не xml-подобный что усложняет задачу, но я все же смог найти там аннотации и думаю смогу это все распарсить. Вторым этапом должно быть добавление аннотаций в pdf-файл, честно говоря я никогда такого не делал, но попробую. Если кто знает хорошие либы для работы с pdf( желательно в питоне, ибо я хочу писать на нем) подскажите.
Code: | ....................3. ......6............... ................4..#pd floc(6389,3,56,0,0,0,0 ,1)Nn.>?.YMe5..?.#.%.g .......4..#pdfloc(6389 ,3,130,12,0,0,1,1);D.. ?.....M.?.-. ..x...... ...7..#pdfloc(6389,6,1 23,0,0,0,0,1)Nn.>?.O.. .6.?.............7..#p dfloc(6389,6,147,6,1,0 ,1,1);..j?.,ak.:t?.(f. 8|..............5?..aQ ^X ?.~....H..#pdfloc(6 389,4,115,4,0,0,1,1).. Test note 1.......8?.. B.G..?.cL.4.c..#pdfloc (6389,7,123,1,1,0,1,1) ..Test note 2....
|
Завел бложик: http://levsha128-programmer.blogspot.com/2010/12/pdf.html
Добавлено спустя 2 часа 8 минут 51 секунду:
Могу ли я побеспокоить счастливого обладателя киндла, у которого есть немного свободного времени? _________________ Kindle 3g |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 29.12.2010 20:03 | |
| Ты пиши, помогу, чем смогу, раз уж я это все заварил _________________ Kindle 3 White 3G, Nook Simple Touch |
| | | Levsha128 Зрелый участник форума
Joined: 24 Dec 2010 Posts: 30
Location: Kherson, Ukraine
| Posted: 29.12.2010 20:11 | |
| Вот файлик: http://www.uafile.com/file/17533/1-pdf.html Пришлите, пожалуйста pdr-ки с таким содержанием: 1)закладкой на эту страницу 2)выделение маркером допустим второй строчки с 5 по 11 символ. 3) заметку к пятой строке со словами "HHHHH"
Это нужно чтобы установить формат файла, ибо исходных данных пока не хватает =) _________________ Kindle 3g |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 29.12.2010 20:31 | |
| 1) закладка есть 2) маркер есть 2: 5-11 3) заметка к 4-му символу 5-й строки Все это в одном файле pdr. Или сделать разными файлами для каждой заметки? http://www.ex.ua/view_storage/563917540092 _________________ Kindle 3 White 3G, Nook Simple Touch |
| | | Levsha128 Зрелый участник форума
Joined: 24 Dec 2010 Posts: 30
Location: Kherson, Ukraine
| Posted: 29.12.2010 20:42 | |
| Пока не нужно =)
p.s. как же это все-таки увлекательно =) _________________ Kindle 3g
Last edited by Levsha128 on 29.12.2010 21:10; edited 1 time in total |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 29.12.2010 20:51 | |
| тут есть кое-что по pdfloc http://www.mobileread.com/forums/showthread.php?s=5579b14661385c26fb12 27f246507f61&t=55079
Добавлено спустя 26 минут 27 секунд:
Есть подозрение, что идти надо с другой стороны. Сначала найти api для работы с pdf, узнать, в каких координатах там указываются данных для разметки. С вероятностью 90% там будут эти же самые pdfloc, т.е. ничего и конвертировать не надо будет. _________________ Kindle 3 White 3G, Nook Simple Touch |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 30.12.2010 16:39 | |
| К вопросу, на чем писать софтину. В полном акробате есть возможность пакетной обработки файлов. В ней, кроме прочих возможностей, можно выполнять акробатовский же яваскрипт, который умеет редактировать пдф-файлы, в частности, создавать в них аннотации различных типов (текст, маркер и т.д.). Так что этот подход дает все необходимые возможности. Доки по яваскрипту есть на сайте адоба. _________________ Kindle 3 White 3G, Nook Simple Touch |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 31.12.2010 12:42 | |
| Вчера было время, поэкспериментировал, расковырял формат файла pdr
Code: | сигнатура: DE AD CA BB 04
00 00
2 байта = номер последней открытой страницы
00 00
2 байта = количество закладок M
M групп закладок { 00 = признак типа 00 00 2 байта = номер страницы с закладкой 2 байта = кол-во символов имени страницы N N байт = имя страницы }
00 00
18 байт: 00 00 00 00 00 00 00 00 02 xx 00 00 00 00 00 00 02 xx
00 00
2 байта = количество выделений маркером M
M групп выделений маркером { 01 = признак типа 00 00 2 байта = номер страницы начала выделения 2 байта = кол-во символов имени страницы N N байт = имя страницы 2 байта = кол-во символов координаты начала N N байт = координата начала #pdfloc(x,x,x,x,x,x,x,x) 20 байт бинарных данных 00 00 2 байта = номер страницы конца выделения 2 байта = кол-во символов имени страницы N N байт = имя страницы 2 байта = кол-во символов координаты конца N N байт = координата конца #pdfloc(x,x,x,x,x,x,x,x) 20 байт бинарных данных 00 00 }
00 00
2 байта = количество текстовых заметок M
M групп текстовых заметок { 02 = признак типа 00 00 2 байта = номер страницы заметки 2 байта = кол-во символов имени страницы N N байт = имя страницы 16 байт бинарных данных 2 байта = кол-во символов координаты заметки N байт = координата заметки #pdfloc(x,x,x,x,x,x,x,x) 2 байта = кол-во символов текста зметки N N байт = текст заметки }
00 00
2 байта = контрастность: 00 00 - 00 04 (lightest - darkest)
Примечания: 1. Нумерация страниц с 0. 2. Все текстовые поля имеют кодировку UTF-8. 3. Имя страницы может быть произвольным, но, чаще всего, это текстовое представление ее номера (здесь нумерация с 1).
|
Теперь только осталось разобрать способ кодирования координат в pdfloc. Возможно, рядом лежащие бинарные данные что-то прояснят. Кстати, где-то на форуме адоба нашел ответ сотрудника адоба, что pdfloc у них приватная кодировка, специально недокументированная. Вот же нехорошие люди! _________________ Kindle 3 White 3G, Nook Simple Touch |
| | | hunger Зрелый участник форума
Joined: 03 Jan 2011 Posts: 24
| Posted: 03.01.2011 02:53 | |
| Ох жеж б....кодеры писали прошивку к киндлу. Оно имя закладки трактует как номер страницы, несмотря на то, что номер страницы сами же зашили в другом месте. Я создал закладки с произвольными именами - не работает. Переименовал их просто в числа - заработало. Ну ни капец. А ведь так хотелось создать с помощью закладок оглавление. Да, а ведь счастье было так возможно... _________________ if (myVar == true) return true; else if (myVar == false) return false; else return !true&&!false; |
| | | Levsha128 Зрелый участник форума
Joined: 24 Dec 2010 Posts: 30
Location: Kherson, Ukraine
| Posted: 03.01.2011 19:50 | |
| SP777, да я уже в принципе это в основном знаю=) Вот после праздников продолжу ковырять pdfloc, ибо заглох я на нем.
Quote: | у них приватная кодировка, специально недокументированная |
Я читал где их разработчик проморозился и сказал что она еще в разработке. _________________ Kindle 3g |
| | | hunger Зрелый участник форума
Joined: 03 Jan 2011 Posts: 24
| Posted: 03.01.2011 20:27 | |
| Кстати, кто-то может выложить пдфку со всеми этими аннотациями. Хочу попробывать зайти с другого конца
Posted after 2 hours 31 minutes 54 seconds:
От блин, мой Киндл DX не поддерживает аннотации к пдфкам. _________________ if (myVar == true) return true; else if (myVar == false) return false; else return !true&&!false; |
| | | cka3o4h1k Искушенный участник форума
Joined: 06 Nov 2010 Posts: 46
| Posted: 16.01.2011 16:30 | |
| Ребята, а разве не проще написать программку, которая будет разбирать My Clippings.txt вообще и отдельную для интеграции аннотаций в исходный файл книги pdf (и в текст mobi)
Вот кстати, немного не по теме, но есть такая наработка: http://willcodejavaforfood.com/my_clippings.html _________________ K3 > NST > KT > K3
Last edited by cka3o4h1k on 16.01.2011 16:56; edited 1 time in total |
| | | SP777 Постоянный участник форума
Joined: 15 Nov 2010 Posts: 153
Location: Харьков
| Posted: 16.01.2011 16:48 | |
| cka3o4h1k, в My Clippings не указываются точные координаты аннотаций и выделения на странице. Кроме того, если будут файлы с одинаковым именем (в разных каталогах), их невозможно будет различить. К тому же, файл My Clippings накопительный: можно сделать заметку, потом ее удалить в файле, а в My Clippings она останется.
Levsha128, как у тебя дела с pdfloc? _________________ Kindle 3 White 3G, Nook Simple Touch |
| | | cka3o4h1k Искушенный участник форума
Joined: 06 Nov 2010 Posts: 46
| Posted: 16.01.2011 17:02 | |
| SP777 теперь понятно, пока Киндл в руках не держал и не представляю как workflow с текстом и аннотациями будет проходить на самом деле.
Для меня возможности аннотаций чуть ли не важнее самого чтения. Levsha128, спасибо, надеюсь что всё получиться. _________________ K3 > NST > KT > K3 |
| | | Levsha128 Зрелый участник форума
Joined: 24 Dec 2010 Posts: 30
Location: Kherson, Ukraine
| Posted: 17.01.2011 15:19 | |
| Quote: | Levsha128, как у тебя дела с pdfloc? |
Еще один экзамен сдать и будет нормально, надеюсь
Что самое странное- я интересовался на хабре этим вопросом- никто ничего не знает прям Бермудский треугольник мира IT _________________ Kindle 3g |
| | |
| You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum
|
© Libroom, 2021
|