Перенос аннотаций из киндла в pdf
Goto page 1, 2  Next
 
Libroom Forum IndexAmazon KindleПрограммы для Kindle
AuthorMessage

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 29.12.2010 11:49    

Как известно, все аннотации (выделение, заметки, закладки), сделанные киндлом в pdf-файлах, хранятся рядом в файлах pdr, а также в текстовом виде заносятся в файл My Clippings. Было бы полезно иметь софтину, которая могла бы эти аннотации переносить оттуда в сам pdf-файл стандартными средствами аннотирования акробата, чтобы результаты работы с документом в киндле можно было потом хранить на компьютере неограниченное время. Кто-нибудь готовое решение уже встречал? Если нет, есть ли энтузиасты, готовые взяться за разработку?
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

Levsha128
Зрелый участник форума

Зрелый участник форума



Joined: 24 Dec 2010
Posts: 30


Location: Kherson, Ukraine

Posted: 29.12.2010 15:53    

Если готовых программ нет, то могу попробовать написать, но гарантий не даю. Только пока киндла у меня еще нет,
тестить не на чем =(

Кое что уже есть: http://www.angelfire.com/ego2/idleloop/mbp_reader.html
но тут просто перегон в текстовый файл.
upd: сори, протупил Embarassed
_________________
Kindle 3g


Last edited by Levsha128 on 29.12.2010 16:19; edited 1 time in total
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 29.12.2010 16:13    

Levsha128, эта программка для заметок в формате mbp, которые делаются к файлам azw, mobi. К pdf делаются pdr, там другой формат. Об этом кое-что пишут, моя идея не нова, но пока решений не нашел.

http://www.kindleboards.com/index.php/topic,42168.0.html
http://www.mobileread.com/forums/showthread.php?t=96846
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

Levsha128
Зрелый участник форума

Зрелый участник форума



Joined: 24 Dec 2010
Posts: 30


Location: Kherson, Ukraine

Posted: 29.12.2010 16:17    

2 SP777:
Можешь скинуть файлик в этом формате, интересно поковыряться внутри.
_________________
Kindle 3g
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 29.12.2010 16:51    

Файлы здесь: http://www.ex.ua/view_storage/245295759869
ПДФ не исправлял, чтобы был нетронутый оригинал. Список аннотаций:
Code:
Закладки:
- стр 3
- стр 6

Выделено маркером:
- стр 4, весь второй абзац (со слов "In the general consumer markets")
- стр 7, весь второй абзац (со слов "This Work Programme also includes")

Заметки:
- стр 5, к словам "More intelligent" во втором абзаце, текст заметки "Test note 1"
- стр 8, к словам "This will" в третьем абзаце, текст заметки "Test note 2"

_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

Levsha128
Зрелый участник форума

Зрелый участник форума



Joined: 24 Dec 2010
Posts: 30


Location: Kherson, Ukraine

Posted: 29.12.2010 17:32    

Ага, спасибо, попробую разобраться.

Добавлено спустя 9 минут 1 секунду:

Так, .pdr формат не xml-подобный что усложняет задачу, но я все же смог найти там аннотации и думаю смогу это все распарсить.
Вторым этапом должно быть добавление аннотаций в pdf-файл, честно говоря я никогда такого не делал, но попробую. Если кто знает хорошие либы для работы с pdf( желательно в питоне, ибо я хочу писать на нем) подскажите.

Code:

....................3.
......6...............
................4..#pd
floc(6389,3,56,0,0,0,0
,1)Nn.>?.YMe5..?.#.%.g
.......4..#pdfloc(6389
,3,130,12,0,0,1,1);D..
?.....M.?.-. ..x......
...7..#pdfloc(6389,6,1
23,0,0,0,0,1)Nn.>?.O..
.6.?.............7..#p
dfloc(6389,6,147,6,1,0
,1,1);..j?.,ak.:t?.(f.
8|..............5?..aQ
^X ?.~....H..#pdfloc(6
389,4,115,4,0,0,1,1)..
Test note 1.......8?..
B.G..?.cL.4.c..#pdfloc
(6389,7,123,1,1,0,1,1)
..Test note 2....


Завел бложик: http://levsha128-programmer.blogspot.com/2010/12/pdf.html

Добавлено спустя 2 часа 8 минут 51 секунду:

Могу ли я побеспокоить счастливого обладателя киндла, у которого есть немного свободного времени?
_________________
Kindle 3g
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 29.12.2010 20:03    

Ты пиши, помогу, чем смогу, раз уж я это все заварил Smile
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

Levsha128
Зрелый участник форума

Зрелый участник форума



Joined: 24 Dec 2010
Posts: 30


Location: Kherson, Ukraine

Posted: 29.12.2010 20:11    

Вот файлик:
http://www.uafile.com/file/17533/1-pdf.html
Пришлите, пожалуйста pdr-ки с таким содержанием:
1)закладкой на эту страницу
2)выделение маркером допустим второй строчки с 5 по 11 символ.
3) заметку к пятой строке со словами "HHHHH"

Это нужно чтобы установить формат файла, ибо исходных данных пока не хватает =)
_________________
Kindle 3g
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 29.12.2010 20:31    

1) закладка есть
2) маркер есть 2: 5-11
3) заметка к 4-му символу 5-й строки
Все это в одном файле pdr. Или сделать разными файлами для каждой заметки?
http://www.ex.ua/view_storage/563917540092
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

Levsha128
Зрелый участник форума

Зрелый участник форума



Joined: 24 Dec 2010
Posts: 30


Location: Kherson, Ukraine

Posted: 29.12.2010 20:42    

Пока не нужно =)

p.s. как же это все-таки увлекательно =)
_________________
Kindle 3g


Last edited by Levsha128 on 29.12.2010 21:10; edited 1 time in total
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 29.12.2010 20:51    

тут есть кое-что по pdfloc
http://www.mobileread.com/forums/showthread.php?s=5579b14661385c26fb12 27f246507f61&t=55079

Добавлено спустя 26 минут 27 секунд:

Есть подозрение, что идти надо с другой стороны. Сначала найти api для работы с pdf, узнать, в каких координатах там указываются данных для разметки. С вероятностью 90% там будут эти же самые pdfloc, т.е. ничего и конвертировать не надо будет.
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 30.12.2010 16:39    

К вопросу, на чем писать софтину. В полном акробате есть возможность пакетной обработки файлов. В ней, кроме прочих возможностей, можно выполнять акробатовский же яваскрипт, который умеет редактировать пдф-файлы, в частности, создавать в них аннотации различных типов (текст, маркер и т.д.). Так что этот подход дает все необходимые возможности. Доки по яваскрипту есть на сайте адоба.
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 31.12.2010 12:42    

Вчера было время, поэкспериментировал, расковырял формат файла pdr

Code:
сигнатура: DE AD CA BB 04

00 00

2 байта = номер последней открытой страницы

00 00

2 байта = количество закладок M

M групп закладок
{
00 = признак типа
00 00
2 байта = номер страницы с закладкой
2 байта = кол-во символов имени страницы N
N байт = имя страницы
}

00 00

18 байт: 00 00 00 00 00 00 00 00 02 xx 00 00 00 00 00 00 02 xx

00 00

2 байта = количество выделений маркером M

M групп выделений маркером
{
01 = признак типа
00 00
2 байта = номер страницы начала выделения
2 байта = кол-во символов имени страницы N
N байт = имя страницы
2 байта = кол-во символов координаты начала N
N байт = координата начала #pdfloc(x,x,x,x,x,x,x,x)
20 байт бинарных данных
00 00
2 байта = номер страницы конца выделения
2 байта = кол-во символов имени страницы N
N байт = имя страницы
2 байта = кол-во символов координаты конца N
N байт = координата конца #pdfloc(x,x,x,x,x,x,x,x)
20 байт бинарных данных
00 00
}

00 00

2 байта = количество текстовых заметок M

M групп текстовых заметок
{
02 = признак типа
00 00
2 байта = номер страницы заметки
2 байта = кол-во символов имени страницы N
N байт = имя страницы
16 байт бинарных данных
2 байта = кол-во символов координаты заметки
N байт = координата заметки #pdfloc(x,x,x,x,x,x,x,x)
2 байта = кол-во символов текста зметки N
N байт = текст заметки
}

00 00

2 байта = контрастность: 00 00 - 00 04 (lightest - darkest)


Примечания:
1. Нумерация страниц с 0.
2. Все текстовые поля имеют кодировку UTF-8.
3. Имя страницы может быть произвольным, но, чаще всего, это текстовое представление ее номера (здесь нумерация с 1).


Теперь только осталось разобрать способ кодирования координат в pdfloc. Возможно, рядом лежащие бинарные данные что-то прояснят. Кстати, где-то на форуме адоба нашел ответ сотрудника адоба, что pdfloc у них приватная кодировка, специально недокументированная. Вот же нехорошие люди!
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

hunger
Зрелый участник форума

Зрелый участник форума



Joined: 03 Jan 2011
Posts: 24



Posted: 03.01.2011 02:53    

Ох жеж б....кодеры писали прошивку к киндлу. Оно имя закладки трактует как номер страницы, несмотря на то, что номер страницы сами же зашили в другом месте. Я создал закладки с произвольными именами - не работает. Переименовал их просто в числа - заработало. Ну ни капец. Evil or Very Mad А ведь так хотелось создать с помощью закладок оглавление. Rolling Eyes Да, а ведь счастье было так возможно...
_________________
if (myVar == true) return true;
else if (myVar == false) return false;
else return !true&&!false;
 
View user's profile ^

Levsha128
Зрелый участник форума

Зрелый участник форума



Joined: 24 Dec 2010
Posts: 30


Location: Kherson, Ukraine

Posted: 03.01.2011 19:50    

SP777, да я уже в принципе это в основном знаю=)
Вот после праздников продолжу ковырять pdfloc, ибо заглох я на нем.
Quote:
у них приватная кодировка, специально недокументированная

Я читал где их разработчик проморозился и сказал что она еще в разработке.
_________________
Kindle 3g
 
View user's profile ^

hunger
Зрелый участник форума

Зрелый участник форума



Joined: 03 Jan 2011
Posts: 24



Posted: 03.01.2011 20:27    

Кстати, кто-то может выложить пдфку со всеми этими аннотациями. Хочу попробывать зайти с другого конца Very Happy

Posted after 2 hours 31 minutes 54 seconds:

От блин, мой Киндл DX не поддерживает аннотации к пдфкам. Sad
_________________
if (myVar == true) return true;
else if (myVar == false) return false;
else return !true&&!false;
 
View user's profile ^

cka3o4h1k
Искушенный участник форума

Искушенный участник форума



Joined: 06 Nov 2010
Posts: 46



Posted: 16.01.2011 16:30    

Ребята, а разве не проще написать программку, которая будет разбирать My Clippings.txt вообще и отдельную для интеграции аннотаций в исходный файл книги pdf (и в текст mobi)

Вот кстати, немного не по теме, но есть такая наработка:
http://willcodejavaforfood.com/my_clippings.html
_________________
K3 > NST > KT > K3


Last edited by cka3o4h1k on 16.01.2011 16:56; edited 1 time in total
 
View user's profile ^

SP777
Постоянный участник форума

Постоянный участник форума



Joined: 15 Nov 2010
Posts: 153


Location: Харьков

Posted: 16.01.2011 16:48    

cka3o4h1k, в My Clippings не указываются точные координаты аннотаций и выделения на странице. Кроме того, если будут файлы с одинаковым именем (в разных каталогах), их невозможно будет различить. К тому же, файл My Clippings накопительный: можно сделать заметку, потом ее удалить в файле, а в My Clippings она останется.

Levsha128, как у тебя дела с pdfloc?
_________________
Kindle 3 White 3G, Nook Simple Touch
 
View user's profile ^

cka3o4h1k
Искушенный участник форума

Искушенный участник форума



Joined: 06 Nov 2010
Posts: 46



Posted: 16.01.2011 17:02    

SP777
теперь понятно, пока Киндл в руках не держал и не представляю как workflow с текстом и аннотациями будет проходить на самом деле.

Для меня возможности аннотаций чуть ли не важнее самого чтения.
Levsha128, спасибо, надеюсь что всё получиться.
_________________
K3 > NST > KT > K3
 
View user's profile ^

Levsha128
Зрелый участник форума

Зрелый участник форума



Joined: 24 Dec 2010
Posts: 30


Location: Kherson, Ukraine

Posted: 17.01.2011 15:19    

Quote:
Levsha128, как у тебя дела с pdfloc?

Еще один экзамен сдать и будет нормально, надеюсь Very Happy

Что самое странное- я интересовался на хабре этим вопросом- никто ничего не знает Shocked прям Бермудский треугольник мира IT Surprised
_________________
Kindle 3g
 
View user's profile ^
Libroom Forum IndexAmazon KindleПрограммы для KindleAll times are GMT + 4 Hours
Goto page 1, 2  Next
Page 1 of 2

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© Libroom, 2021