Author | Message |
---|
a_lone Член клуба The eBook
Joined: 16 Sep 2004 Posts: 1724
| Posted: 16.09.2004 18:47 | |
| С недавних пор пользую BookDesigner 4.0, до сих пор все было хорошо. Теперь вот столкнулся с тем, что символы в non-English кодировках, отличных от кириллицы, переводятся в кириллицу или в первые 128 символов. Как это было. Нашел я наконец-то Лема на польском языке, в формате ворд, обрадовался, но потом думаю - а чем я его буду на Палме читать? Во-первых, польсифицировал интерфейс (Пайлок) Во-вторых, попробовал DocumentsToGo. Этот все понимает, если в документе есть только одна кодировка. Приятно было видеть все эти закорючки, но читать в нем - увы и ах В-третьих, RepliGo - тоже все хорошо, но в нем нет переносов В-четвертых, вспомнил про BookDesigner. Первая проблема - при считывании html или doc пропадают те самые (сабж) символы. Типа их нет. В ворде они видны, отсюда - нет. Хтмл делался как windows-1251 так и windows-1250. Этот вариант отпадает сразу. После некоторых мучений сделал я fb2, загнал его в BookDesigner - те самые символы заменились на 1251, где англицкие, где русские. То же самое после конвертации на Палме.
В результате я остался с iSilo, который без проблем проглотил html, сохранил форматирование... но в нем нет переносов. Есть ли какой-нить способ заставить BookDesigner понимать документы в 1250, к примеру? Я смогу прочесть и без загогулин, но как-то это некомфортно |
| | | Libroom Член клуба The eBook
Joined: 10 Jun 2003 Posts: 23551
| Posted: 16.09.2004 20:59 | |
| Пшепрашем Пана, але не с тего Пан начаул.
Все еще проще! Вам нужно поставить себе программу MobiReader и не зависимо от системы поставить mobitype шрифты, потому что программа будет именно их использовать и совсем без разницы что там в системе.
Поэтому посмотрите посты которые делал Гера по поводу шрифтов mobitype, там есть упоминание о конвертере truetype шрифтов в формат mobitype. |
| | | vvv Автор программы BookDesigner
Joined: 18 Jun 2003 Posts: 2690
| Posted: 16.09.2004 21:31 | |
| a_lone wrote: | С недавних пор пользую BookDesigner 4.0, до сих пор все было хорошо. Теперь вот столкнулся с тем, что символы в non-English кодировках, отличных от кириллицы, переводятся в кириллицу или в первые 128 символов. Как это было. Нашел я наконец-то Лема на польском языке, в формате ворд, обрадовался, но потом думаю - а чем я его буду на Палме читать? Во-первых, польсифицировал интерфейс (Пайлок) Во-вторых, попробовал DocumentsToGo. Этот все понимает, если в документе есть только одна кодировка. Приятно было видеть все эти закорючки, но читать в нем - увы и ах В-третьих, RepliGo - тоже все хорошо, но в нем нет переносов В-четвертых, вспомнил про BookDesigner. Первая проблема - при считывании html или doc пропадают те самые (сабж) символы. Типа их нет. В ворде они видны, отсюда - нет. Хтмл делался как windows-1251 так и windows-1250. Этот вариант отпадает сразу. После некоторых мучений сделал я fb2, загнал его в BookDesigner - те самые символы заменились на 1251, где англицкие, где русские. То же самое после конвертации на Палме.
В результате я остался с iSilo, который без проблем проглотил html, сохранил форматирование... но в нем нет переносов. Есть ли какой-нить способ заставить BookDesigner понимать документы в 1250, к примеру? Я смогу прочесть и без загогулин, но как-то это некомфортно |
Полную поддержку восточно-европейских языков в BD я не делал. В основном, по причине того, что я их не знаю. Частичная же может быть обеспечена следующим образом. 1. Settings: MultiLanguage support: отмечено book language: German 2. Загрузить книгу 3. Правый клик - > encoding -> Central Europian (Windows) |
| | | a_lone Член клуба The eBook
Joined: 16 Sep 2004 Posts: 1724
| Posted: 17.09.2004 11:07 | |
| vvv wrote: | Полную поддержку восточно-европейских языков в BD я не делал. В основном, по причине того, что я их не знаю. Частичная же может быть обеспечена следующим образом. 1. Settings: MultiLanguage support: отмечено book language: German 2. Загрузить книгу 3. Правый клик - > encoding -> Central Europian (Windows) |
Спасибо за совет, так и сделал - и получил в конце концов почти желаемое... Однако только из XML - в действительности это был файл FB2 c расширением XML. Я так понимаю, что при считывании FB2 применяется иной алгоритм, чем при считывании XML? Далее - все-таки не все буквы правильны. Скажем, фивти-фивти. Уже лучше, но все же...
Кстати, а почему бы внутри программы не хранить в юникоде книгу? Тогда бы все проблемы ушли - плюс дать пользователю выбрать не просто шрифт, а шрифт с codepage.
Libroom wrote: | Пшепрашем Пана, але не с тего Пан начаул.
Все еще проще! Вам нужно поставить себе программу MobiReader и не зависимо от системы поставить mobitype шрифты, потому что программа будет именно их использовать и совсем без разницы что там в системе.
Поэтому посмотрите посты которые делал Гера по поводу шрифтов mobitype, там есть упоминание о конвертере truetype шрифтов в формат mobitype. |
Спасибо, эту программу я как-то не пробовал, но чуствую - нужно |
| | | Libroom Член клуба The eBook
Joined: 10 Jun 2003 Posts: 23551
| Posted: 17.09.2004 11:19 | |
| Только я не уверен в ответе Валеры. Дело в том, что немецкий алфавит, это не польский. Если в немецком присутствуют такие буквы как:
üéäá и т.д.
то в польском отличительные буквы выглядят, ну и читаются по другому:
ą ó ł ś ć ó ę ż и т.д.
Поэтому лучше использовать специальный шрифт для чтения.
Для тех кому не видны буквы на экране:
|
| | | a_lone Член клуба The eBook
Joined: 16 Sep 2004 Posts: 1724
| Posted: 17.09.2004 13:33 | |
| Может, я что-то не понимаю, однако...
1) Я могу использовать спец шрифт для чтения, однако, гм, я не могу в BookDesigner открыть источник с сохранением этих специфических символов (они заменяются), пробовал и doc, и html, b xml. Может, чем-то другим можно конвертнуть fb2 в pdb? Или doc в fb2, помимо ExportXML.dot (этот в кодировке, отличной от юникода, тоже "конвертит" спец символы), в кодировке windows-1250?
2) С моим предыдущим постом я поспешил - BookDesigner сохраняет в той же кодировке, в моем случае - в UTF8, палма такое, ессно не понимает - имею prc с юникодным текстом. В любом случае не все символы правильно отбражаются. |
| | | Libroom Член клуба The eBook
Joined: 10 Jun 2003 Posts: 23551
| Posted: 17.09.2004 13:54 | |
| 1. Я не понял про FB2 и польский язык... Или уже где-то готовые тексты в ензыку польским?
2. UTF-8 оптимально для Mobireader.
Вообще с польским придется экспериментировать. |
| | | a_lone Член клуба The eBook
Joined: 16 Sep 2004 Posts: 1724
| Posted: 17.09.2004 15:29 | |
| Libroom wrote: | 1. Я не понял про FB2 и польский язык... Или уже где-то готовые тексты в ензыку польским?
|
Да, есть тексты в формате DOC. Я уже сейчас могу их читать в RepliGo, DocumentsToGo, iSilo - но неудобно, поэтому хочу сконвертировать в ПалмДок. С сохранением форматирования. Но не могу.
Quote: | 2. UTF-8 оптимально для Mobireader.
Вообще с польским придется экспериментировать. |
Разве Mobireader понимает юникод? Я подсунул ему prc, но юникод так и остался нераскодированным. |
| | | Libroom Член клуба The eBook
Joined: 10 Jun 2003 Posts: 23551
| | | | gera_serg Кандидат в члены клуба The eBook
Joined: 10 Feb 2004 Posts: 310
| Posted: 17.09.2004 17:32 | |
| a_lone
Предлагаю попробовать воспользоваться читалкой на Пальме PalmFiction 1. Она сама делает переносы по алгоритму сочетаний гласный - негласный, возможно и в польском переносы будут допустимо выглядеть. 2. На сайте автора есть конвертор сглаженных шрифтов 3. Читает простой TXT, простой PDB, zTXT 4. Если не нужен сглаженный шрифт, используй системные от польского Piloc
Если пришлешь польский ttf шрифт могу попробовать сделать вариант для МобиРидера, но все равно не факт, что BD правильно расставит переносы для польского |
| | | vvv Автор программы BookDesigner
Joined: 18 Jun 2003 Posts: 2690
| Posted: 17.09.2004 21:48 | |
| a_lone wrote: | Может, я что-то не понимаю, однако...
1) Я могу использовать спец шрифт для чтения, однако, гм, я не могу в BookDesigner открыть источник с сохранением этих специфических символов (они заменяются), пробовал и doc, и html, b xml. Может, чем-то другим можно конвертнуть fb2 в pdb? Или doc в fb2, помимо ExportXML.dot (этот в кодировке, отличной от юникода, тоже "конвертит" спец символы), в кодировке windows-1250?
|
Для чтения можно открыть текст в любой кодировке. А вот правильно сконвертировать в pdb - пока только тексты для языков, включенных в win-1251 и win-1252. Немецкий же язык был рекомендован по причине того, что в нем, в отличие от русского или французского, всего 7 символов в расширенных ASCII. Следовательно, перекрытие с польским будет минимальным. Видимо, пора делать полную поддержку польского языка (Вы не первый, кто об этом спрашивает, значит - назрело). Но польского я не знаю и здесь мне нужна помошь. И вот в каком плане. 1. Пришлите, пожалуйста, несколько книг на польском. 2. Польский алфавит (символ каждой буквы и ее номер в ASCII и юникодной таблицах). |
| | | Libroom Член клуба The eBook
Joined: 10 Jun 2003 Posts: 23551
| Posted: 18.09.2004 14:20 | |
| Польских книг у меня нет, к сожалению, а с кодировкой разобрался. Используется кодировка для Windows, Unix, Linux, WWW, mail и terminal одна и таже кодировка – ISO8859-2, таблицу прикладываю ниже.
Code: | Polska Norma dotycząca sposobu kodowania polskich znaków nosi oznaczenie:
PN-93 T-42118
i jest ZGODNA z ISO 8859-2, a więc aby być w zgodzie z Polską Normą należy stosować następujące kodowanie polskich znaków:
Ą Ć Ę Ł Ń Ó Ś Ź Ż 161 198 202 163 209 211 166 172 175
ą ć ę ł ń ó ś ź ż 177 230 234 179 241 243 182 188 191 |
Нормальный способ кодирования польских знаков имеет наименование:
PN-93 T-42118
также есть необходимые знаки в кодировке ISO 8859-2... ну и перечислены особенные знаки, отличные от roman.
Если еще нужны какие сведения, спрашивай. Поищу.
|
| | | GribUser Fictionbook.Lib, FB2, Divide&Conquer
Joined: 18 Jun 2003 Posts: 7297
Location: Мордор (северный Гандурас)
| Posted: 19.09.2004 21:16 | |
| btw fb2any теперь позволяет экспортить fb2 в текст c любуй кодировкой. А FBTools умеют экспортить в HTML в любой кодировке от рождения, практически. В палмо-пригодный формат пока экспортить нельзя, правда, но makedoc какой-нить можно заюзать. При желании. |
| | | a_lone Член клуба The eBook
Joined: 16 Sep 2004 Posts: 1724
| Posted: 20.09.2004 18:13 | |
| В общем, получилось все не то чтобы очень просто, но близко к этому понятию. Из doc формата я сделал html с windows-1250 кодировкой, который, в свою очередь, скормил to TibrConverter. На выходе получил вполне приличный PalmDoc с сохранением форматирования, который одинаково хорошо (ну, почти одинаково хорошо) читается в MobiPocket и в PF. Второй вариант - скормить тот же HTML to MobiPocketPublisher. Результат - почти такой же, кроме всяких напоминаний про необходимость купить про-версию и дополнительных возможностей. Третий вариант - самый простой, но без форматирования - копируем doc на палму, открываем в DocumentToGo (не ниже 7-ки) и сохраняем в PalmDoc.
Осталось найти шрифты для PF и MobiReader, чтобы не переключать каждый раз Pyloc и иметь красивую картинку |
| | | vvv Автор программы BookDesigner
Joined: 18 Jun 2003 Posts: 2690
| Posted: 20.09.2004 23:50 | |
| Libroom wrote: | Польских книг у меня нет, к сожалению, а с кодировкой разобрался. Используется кодировка для Windows, Unix, Linux, WWW, mail и terminal одна и таже кодировка – ISO8859-2, таблицу прикладываю ниже.
|
Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка). |
| | | a_lone Член клуба The eBook
Joined: 16 Sep 2004 Posts: 1724
| Posted: 21.09.2004 01:11 | |
| vvv wrote: | Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка). |
Книги на польском - пожалуйста, сколько угодно. Могу переслать (куда?), а можете просто скачать с сайта http://artefact.lib.ru/library/lem.htm |
| | | vvv Автор программы BookDesigner
Joined: 18 Jun 2003 Posts: 2690
| Posted: 21.09.2004 01:18 | |
| a_lone wrote: | vvv wrote: | Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка). |
Книги на польском - пожалуйста, сколько угодно. Могу переслать (куда?), а можете просто скачать с сайта http://artefact.lib.ru/library/lem.htm |
Спасибо, скачал. |
| | | vvv Автор программы BookDesigner
Joined: 18 Jun 2003 Posts: 2690
| Posted: 21.09.2004 05:19 | |
| Libroom wrote: | Польских книг у меня нет, к сожалению, а с кодировкой разобрался. Используется кодировка для Windows, Unix, Linux, WWW, mail и terminal одна и таже кодировка – ISO8859-2, таблицу прикладываю ниже.
Code: | Ą Ć Ę Ł Ń Ó Ś Ź Ż 161 198 202 163 209 211 166 172 175 ą ć ę ł ń ó ś ź ż 177 230 234 179 241 243 182 188 191 |
|
Ох и нехороший же человек билл, сосиска, сарделька, Навуходоносер и петух гамбургский. Вообщем, у этой американской сосиски-сардельки и т.д. свое понимание польского алфавита (различается в шести следующих буквах)
Code: | Ą Ś Ź 165 140 143 ą ś ź 185 156 159 |
А может ты чего напутал, но, зная билла, думаю, что нехороший человек - он.
Last edited by vvv on 21.09.2004 05:43; edited 1 time in total |
| | | vvv Автор программы BookDesigner
Joined: 18 Jun 2003 Posts: 2690
| Posted: 21.09.2004 05:29 | |
| a_lone wrote: | vvv wrote: | Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка). |
Книги на польском - пожалуйста, сколько угодно. Могу переслать (куда?), а можете просто скачать с сайта http://artefact.lib.ru/library/lem.htm |
Можете попробовать поддержку польского в BD. Скачайте этот файл и распакуйте его в директорию Book Designer 4.0. http://www.the-ebook.org/e107/e107_files/downloads/bd/BdPolish.zip
Польские книги выглядят на экране BD вот так
Перед загрузкой польских книг надо сделать следующие назначения в Settings: keep origrnal format: отмечено MultiLanguage support: отмечено book language: Polish
Для чтения польских книг на Палм надо ставить соответствующий шрифт. Где искать - не знаю, посмотрите на польских палмовских сайтах. Также можете попросить у Геры редактов шрифтов Моби, взять за основу любой шрифт и дорисовать в соответствующих местах 18 польских букв.
А мне любопытно, много ли багов насажал (особенно в переносах): программировать поддержку языка при полном его незнаниии - это, знаете ли, забавно, что-то сродни мазохизму... Подозреваю, что раньше только билл такое делал |
| | | Libroom Член клуба The eBook
Joined: 10 Jun 2003 Posts: 23551
| Posted: 21.09.2004 07:36 | |
| vvv wrote: | А мне любопытно, много ли багов насажал (особенно в переносах): программировать поддержку языка при полном его незнаниии - это, знаете ли, забавно, что-то сродни мазохизму... Подозреваю, что раньше только билл такое делал |
Ну судя по скриншоту, только в одном месте ошибка в переносах, слово "работа" - pracujance... эта буква "А с ножной", читается в конце буквы как "носовая Н". Звучит - "ПРАЦУЁнЦЭ". Так что после этой буквы должен быть перенос.
Сложнее было бы сделать переносы для Чешского языка - мало гласных, много согласных. Например слово "верба", в чешском звучит как "vrba"... попробуй поставить перенос! гыгыгы |
| | |
| You cannot post new topics in this forum You cannot reply to topics in this forum You cannot edit your posts in this forum You cannot delete your posts in this forum You cannot vote in polls in this forum
|
© Libroom, 2021
|