А все-таки что-то неладно в датском королевстве...
Goto page 1, 2  Next
 
Libroom Forum IndexBook Designer
AuthorMessage

SeNS
Член клуба The eBook

Член клуба The eBook



Joined: 18 Jun 2003
Posts: 5559


Location: Boston

Posted: 11.12.2004 02:08    

Берем прекрасно подготовленный doc-файл, например, с произведением Саши Тараторина "Дурная компания" http://vasaros.com/art/taratorin/badcomp/durnaja_kompania.doc (там их много разных, рекомендую к прочтению тем, кто не читал). В документе есть обложка, содержание, ссылки - все оформлено правильно и в MS Word-е выглядит очень даже красиво и "ибучно". Пробуем мы сконвертировать эту красоту в продвинутый формат (отец всех форматов!) fb2.

"Нет лучше конвертора, чем BD и Валера пророк его" Smile После достаточно длительного процесса конвертирования, удаления, преобразования от текста остались лишь рожки да ножки... Вот те на Sad

Берем непримеримого конкурента - Any2FB. Результат получше (текст, по крайней мере, остался цел), но вот остальное явно оставляет желать лучшего. Прекрасная обложка Горчева ушла в небытие Sad , ссылки ссылаются на абсолютно невразумительные тексты, содержание опять-таки развернулось во внутренне-вордовое представление ссылок. Названия глав то становятся эпиграфами, то вообще просто "висящим" текстом... Sad

Вопрос к нашим многоуважаемым авторам - когда-же?! Когда можно будет напустить BD или Any2FB на нормально отформатированный doc и получить адекватный fb2 файл? Притом делать это единственным легким нажатием левой кнопки мыши... Без последующей доводки напильником до работающего образца.
 
View user's profile ^

FiL
Член клуба The eBook

Член клуба The eBook



Joined: 04 Sep 2004
Posts: 3337


Location: Boston

Posted: 11.12.2004 02:20    

Тогда, когда народ перестанет доки хранить в доках.
Сейчас берем док, открываем в офис2003, сохраняем как xml - потом конвертим. Должно получиться.
_________________
Владение орфографией как владение кунг-фу:
настоящие мастера не применяют его без необходимости
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 11.12.2004 05:20    

SeNS wrote:
Берем прекрасно подготовленный doc-файл, например, с произведением Саши Тараторина "Дурная компания" http://vasaros.com/art/taratorin/badcomp/durnaja_kompania.doc (там их много разных, рекомендую к прочтению тем, кто не читал). В документе есть обложка, содержание, ссылки - все оформлено правильно и в MS Word-е выглядит очень даже красиво и "ибучно". Пробуем мы сконвертировать эту красоту в продвинутый формат (отец всех форматов!) fb2.

"Нет лучше конвертора, чем BD и Валера пророк его" Smile После достаточно длительного процесса конвертирования, удаления, преобразования от текста остались лишь рожки да ножки... Вот те на Sad

Берем непримеримого конкурента - Any2FB. Результат получше (текст, по крайней мере, остался цел), но вот остальное явно оставляет желать лучшего. Прекрасная обложка Горчева ушла в небытие Sad , ссылки ссылаются на абсолютно невразумительные тексты, содержание опять-таки развернулось во внутренне-вордовое представление ссылок. Названия глав то становятся эпиграфами, то вообще просто "висящим" текстом... Sad

Вопрос к нашим многоуважаемым авторам - когда-же?! Когда можно будет напустить BD или Any2FB на нормально отформатированный doc и получить адекватный fb2 файл? Притом делать это единственным легким нажатием левой кнопки мыши... Без последующей доводки напильником до работающего образца.

И доколи, доколи
И всегда, и везде
Будут Клодтовы кони
Подчиняться узде...

А кто тебе сказал, что файл сделан правильно? Попробуй сконвертировать его через Ворд в html, а потом посмотри, что получится (обрати внимание на назначение charset и реальное содержимое html).
 
View user's profile ^

boroda
Developer

Developer

Donate

Joined: 03 Jul 2003
Posts: 6203


Location: США

Posted: 11.12.2004 08:14    

Надо делать в 3 шага:

1. Сохраняем оригинальный DOC как RTF файл.
2. Открываем полученный RTF в Ворде, сохраняем его как Filtered HTML
3. Полученный HTML хорошо переваривается BD.

В Офисе 2003 надо показать Reviewing тулбар и нажать на кнопочку Accept All Changes (для того чтобы текущие сохраненные изменения не оставались в HTML).
 
View user's profile ^

SeNS
Член клуба The eBook

Член клуба The eBook



Joined: 18 Jun 2003
Posts: 5559


Location: Boston

Posted: 11.12.2004 21:42    

vvv wrote:
А кто тебе сказал, что файл сделан правильно? Попробуй сконвертировать его через Ворд в html, а потом посмотри, что получится (обрати внимание на назначение charset и реальное содержимое html).


"А вы на шкаф залезть попробуйте!" (с) старый анекдот. Как-то ты все-таки неадекватно к критике (заметь, справедливой!) относишься...

Валера, поскольку этот файл открывается MS Word-ом без ошибок - я делаю вывод, что файл - правильный. И, поскольку, способ, предложенный borod-ой, тоже работает (правда, не знаю, как убрать непонимаемые haali теги <strong> и что-то еще для subtitles (пришлось преобразовать их в titles) - может, имеет смысл "подкрутить" BD на предмет большей совместимости с MS Word? Использовать те-же MS ковертеры, перегонять в filtered HTML и оттуда уже крутить?

P.S. Еще по мелочам:
- автор текста непрвильно преобразуется (в ???????? )
- как запретить использовать нераспознаваемые FB2 (haali) теги?
- почему-бы не сделать возможность создавать выходной файл в том-же каталоге, что и исходный?
 
View user's profile ^

SeNS
Член клуба The eBook

Член клуба The eBook



Joined: 18 Jun 2003
Posts: 5559


Location: Boston

Posted: 11.12.2004 21:50    

boroda wrote:
Надо делать в 3 шага:

1. Сохраняем оригинальный DOC как RTF файл.
2. Открываем полученный RTF в Ворде, сохраняем его как Filtered HTML
3. Полученный HTML хорошо переваривается BD.

В Офисе 2003 надо показать Reviewing тулбар и нажать на кнопочку Accept All Changes (для того чтобы текущие сохраненные изменения не оставались в HTML).


Спасибо, так - работает. Но (о чем, собственно, и топик) хочется одношагового решения. Тем более, что это явно не rocket science... Просто я пытаюсь уговорить Валеру переписать (улучшить) алгоритм конвертации doc-файлов Smile Думаю, что word-овские doc-и еще достаточно долго будут актуальными.

P.S. 2 Fil, vvv, и прочим поборникам "не микрософтовских решений" - да, я согласен, MS Word - далеко не лучший формат. Но, imho, существование множества текстов в этом формате - это "объективная реальность, данная нам в ощущениях". И тем более есть потребность в "однокнопочном" решении для перевода ненавистного doc в правильный FB2!

P.P.S. Take it easy Laughing
 
View user's profile ^

FiL
Член клуба The eBook

Член клуба The eBook



Joined: 04 Sep 2004
Posts: 3337


Location: Boston

Posted: 12.12.2004 10:11    

Не, это у тебя "не микрософтовское решение". У меня как раз микрософтовское. У меня просто такое ощущение, что в общем случае док правильно может открыть только ворд. А все остальные - как получится. Когда хорошо, а когда и не очень.
_________________
Владение орфографией как владение кунг-фу:
настоящие мастера не применяют его без необходимости
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 13.12.2004 23:16    

SeNS wrote:
vvv wrote:
А кто тебе сказал, что файл сделан правильно? Попробуй сконвертировать его через Ворд в html, а потом посмотри, что получится (обрати внимание на назначение charset и реальное содержимое html).


"А вы на шкаф залезть попробуйте!" (с) старый анекдот. Как-то ты все-таки неадекватно к критике (заметь, справедливой!) относишься...

Валера, поскольку этот файл открывается MS Word-ом без ошибок - я делаю вывод, что файл - правильный. И, поскольку, способ, предложенный borod-ой, тоже работает (правда, не знаю, как убрать непонимаемые haali теги <strong> и что-то еще для subtitles (пришлось преобразовать их в titles) - может, имеет смысл "подкрутить" BD на предмет большей совместимости с MS Word? Использовать те-же MS ковертеры, перегонять в filtered HTML и оттуда уже крутить?

BD постоянно подкручивается на предмет улучшения совместимости с Вордом. Но, т.к. Ворд теоретически плохо предсказуем, проблемы решаются по мере появления экспериментального материала. Вот твой файл появился - значит придется приделать к CharsetDetector еще и опцию автоопределения html-unicode.
SeNS wrote:

P.S. Еще по мелочам:
- автор текста непрвильно преобразуется (в ???????? )
- как запретить использовать нераспознаваемые FB2 (haali) теги?
- почему-бы не сделать возможность создавать выходной файл в том-же каталоге, что и исходный?

В старых версиях BD автор текста заменялся на ???????? в том случае, если его не удавалось распознать автоматически.
Вообще-то haali <strong> понимает. Но, если хочешь убрать их из fb2, то установи последний апдейт. В него добавлена опция "keep BD styles".
Назначение выходного каталога: Settings -> set path.
 
View user's profile ^

SeNS
Член клуба The eBook

Член клуба The eBook



Joined: 18 Jun 2003
Posts: 5559


Location: Boston

Posted: 13.12.2004 23:40    

vvv wrote:
BD постоянно подкручивается на предмет улучшения совместимости с Вордом. Но, т.к. Ворд теоретически плохо предсказуем, проблемы решаются по мере появления экспериментального материала. Вот твой файл появился - значит придется приделать к CharsetDetector еще и опцию автоопределения html-unicode.


Во, уже голос не мальчика но мужа! Smile Валер, а может, вообще переделать алгоритм обработки Word-а? Пусть сам билл и поработает? Т.е. запускать его как com-объект и хреначить ему команды. Все равно он должен быть установлен.

SeNS wrote:

P.S. Еще по мелочам:
- автор текста непрвильно преобразуется (в ???????? )
- как запретить использовать нераспознаваемые FB2 (haali) теги?
- почему-бы не сделать возможность создавать выходной файл в том-же каталоге, что и исходный?


vvv wrote:

В старых версиях BD автор текста заменялся на ???????? в том случае, если его не удавалось распознать автоматически.
Вообще-то haali <strong> понимает. Но, если хочешь убрать их из fb2, то установи последний апдейт. В него добавлена опция "keep BD styles".


Так работает. Только теперь ругается на закрывающий </body> Разбираюсь вот. Update: разобрался. потерялся тэг </section> перед </body>.

vvv wrote:

Назначение выходного каталога: Settings -> set path.


Там можно указать только абсолютный путь. А мне хочется - относительный (скажем, путь исходного файла)

P.S. Да, название файла внутри зипа желательно делать в OEM-кодировке - так его нормально понимает Haali и FAR-овские плагины (или предусмотреть опцию)
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 14.12.2004 05:54    

SeNS wrote:

Валер, а может, вообще переделать алгоритм обработки Word-а? Пусть сам билл и поработает? Т.е. запускать его как com-объект и хреначить ему команды. Все равно он должен быть установлен.

Твоими бы устами... Оно именно так и работает. После множества экспериментов со всякими левыми doc-конверторами я остановился именно на билле. По принципу "сам навалял - пусть сам и расхлебывает" Very Happy . Глюки, конечно есть, но, в отличии от левых конверторов, в подавляещем числе случаев работает правильно.

А главная проблема не в билловком преобразовании doc->html, а в очистке того безобразия, что он выдает на выходе. Жуть там еще та, но зато более-менее стандартизирована, поэтому есть возможности ее вычистки. И вот с этой-то очисткой я и воюю по мере накопления экспериментального материала. Кстати, твой левый файл помог улучшить ситуацию (не только в смысле ущучивания html-unicode, но и для форматирования в целом). Теперь он занимает почетное место в моей коллекции билловских безобразий. Если интересно - могу прислать апдейт BD. Заодно и посмотришь, не упустил ли я там чего-нибудь.
SeNS wrote:

Так работает. Только теперь ругается на закрывающий </body> Разбираюсь вот. Update: разобрался. потерялся тэг </section> перед </body>.

Пришли файлик, посмотрю.
 
View user's profile ^

AGrey
Guest









Posted: 14.12.2004 12:49    

SeNS wrote:
Вопрос к нашим многоуважаемым авторам - когда-же?! Когда можно будет напустить BD или Any2FB на нормально отформатированный doc и получить адекватный fb2 файл? Притом делать это единственным легким нажатием левой кнопки мыши... Без последующей доводки напильником до работающего образца.
Вечный двигатель захотел - их не бывает. Без напильника FB не сделаешь. Это абсолютная истина.
 
^

Mike_i
Модератор форума "Новости"

Модератор форума



Joined: 22 Jun 2003
Posts: 12271


Location: It is freaking +8 outside...

Posted: 14.12.2004 13:34    

А я думаю, через 3-4 года, если закон Мура не выдохнется. 100% конечно не будет, но и 99.5 думаю, всех устроит.
_________________
You William Blake? Yes, I am. Do you know my poetry? (с) Dead Man
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 14.12.2004 22:18    

Mike_i wrote:
А я думаю, через 3-4 года, если закон Мура не выдохнется. 100% конечно не будет, но и 99.5 думаю, всех устроит.

А если валидатор отменят - то вчера Very Happy
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 14.12.2004 22:46    

LaughingLaughingLaughingLaughing
 
View user's profile ^

AGrey
Guest









Posted: 15.12.2004 10:06    

vvv wrote:
Mike_i wrote:
А я думаю, через 3-4 года, если закон Мура не выдохнется. 100% конечно не будет, но и 99.5 думаю, всех устроит.

А если валидатор отменят - то вчера Very Happy

Только это уже не будет формат с гарантированной структурой, и любая программа обработки структуры будет чихать.
А в самом деле, можно и базы данных отменить и хранить цифры в формате html0, к чему выпендриваться? LaughingLaughingLaughing
 
^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 15.12.2004 21:06    

alexs wrote:
vvv wrote:
Mike_i wrote:
А я думаю, через 3-4 года, если закон Мура не выдохнется. 100% конечно не будет, но и 99.5 думаю, всех устроит.

А если валидатор отменят - то вчера Very Happy

Только это уже не будет формат с гарантированной структурой, и любая программа обработки структуры будет чихать.

HR не будет. Не раз проверял Very Happy. BD тоже не будет. А больше fb2 никто и не читает Sad .
 
View user's profile ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Joined: 18 Jun 2003
Posts: 7297


Location: Мордор (северный Гандурас)

Posted: 15.12.2004 22:33    

vvv wrote:
HR не будет. Не раз проверял Very Happy. BD тоже не будет. А больше fb2 никто и не читает Sad .
Приятно, когда создатель программы что-то атм лапочет, а наш Гуру - твердо обещает светлое будущее. Хорошо, все-таки, что у нас есть человек, который знает о HR и его будещем больше автора...
 
View user's profile ^

SeNS
Член клуба The eBook

Член клуба The eBook



Joined: 18 Jun 2003
Posts: 5559


Location: Boston

Posted: 16.12.2004 09:58    

GribUser wrote:
vvv wrote:
HR не будет. Не раз проверял Very Happy. BD тоже не будет. А больше fb2 никто и не читает Sad .
Приятно, когда создатель программы что-то атм лапочет, а наш Гуру - твердо обещает светлое будущее. Хорошо, все-таки, что у нас есть человек, который знает о HR и его будещем больше автора...


Не, ребята, вы прямо как кошка с собакой Smile Как будто оба не фриварщики, не энтузизисты, не ибуковцы etc. Одно дело делаете ведь! Какая разница, чья тулза "кручее" и "правильнее"? Главное - сделать FB2 стандартом "де факто" для электронных книг, а для этого нужны удобные безошибочные тулзы. Чем легче будет конвертировать тексты из любого формата в FB2, тем популярнее этот формат будет (а формат-то неплох!) Как сказал В. И. Ленин в своей исторической работе "Ибукостроение или как нам реорганизовать LIB.RU" - "Из всех форматов наиболее значимым для нас является FB2!" Laughing

P.S. 2 GribUser: Димка, а чем, собственно, Мишка (haali) конвертирует (если конвертирует) книжки в fb2?
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 16.12.2004 11:29    

Как говорится, еще не написана лучшая программа...
 
View user's profile ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Joined: 18 Jun 2003
Posts: 7297


Location: Мордор (северный Гандурас)

Posted: 16.12.2004 13:07    

SeNS wrote:
P.S. 2 GribUser: Димка, а чем, собственно, Мишка (haali) конвертирует (если конвертирует) книжки в fb2?
Он либо читает текст, либо берет готовые а если ни то ни другое не катит, конвертит своим вордовым скриптом.
 
View user's profile ^
Libroom Forum IndexBook DesignerAll times are GMT + 4 Hours
Goto page 1, 2  Next
Page 1 of 2

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© Libroom, 2021