Non-english & non-cyrillic symbols в BookDesig
Goto page 1, 2  Next
 
Libroom Forum IndexBook Designer
AuthorMessage

a_lone
Член клуба The eBook

Член клуба The eBook



Joined: 16 Sep 2004
Posts: 1724



Posted: 16.09.2004 18:47    

С недавних пор пользую BookDesigner 4.0, до сих пор все было хорошо. Теперь вот столкнулся с тем, что символы в non-English кодировках, отличных от кириллицы, переводятся в кириллицу или в первые 128 символов.
Как это было.
Нашел я наконец-то Лема на польском языке, в формате ворд, обрадовался, но потом думаю - а чем я его буду на Палме читать?
Во-первых, польсифицировал интерфейс (Пайлок)
Во-вторых, попробовал DocumentsToGo. Этот все понимает, если в документе есть только одна кодировка. Приятно было видеть все эти закорючки, но читать в нем - увы и ах
В-третьих, RepliGo - тоже все хорошо, но в нем нет переносов
В-четвертых, вспомнил про BookDesigner. Первая проблема - при считывании html или doc пропадают те самые (сабж) символы. Типа их нет. В ворде они видны, отсюда - нет. Хтмл делался как windows-1251 так и windows-1250. Этот вариант отпадает сразу. После некоторых мучений сделал я fb2, загнал его в BookDesigner - те самые символы заменились на 1251, где англицкие, где русские. То же самое после конвертации на Палме.

В результате я остался с iSilo, который без проблем проглотил html, сохранил форматирование... но в нем нет переносов. Есть ли какой-нить способ заставить BookDesigner понимать документы в 1250, к примеру? Я смогу прочесть и без загогулин, но как-то это некомфортно Sad
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 16.09.2004 20:59    

Пшепрашем Пана, але не с тего Пан начаул. Smile

Все еще проще! Вам нужно поставить себе программу MobiReader и не зависимо от системы поставить mobitype шрифты, потому что программа будет именно их использовать и совсем без разницы что там в системе.

Поэтому посмотрите посты которые делал Гера по поводу шрифтов mobitype, там есть упоминание о конвертере truetype шрифтов в формат mobitype.
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 16.09.2004 21:31    

a_lone wrote:
С недавних пор пользую BookDesigner 4.0, до сих пор все было хорошо. Теперь вот столкнулся с тем, что символы в non-English кодировках, отличных от кириллицы, переводятся в кириллицу или в первые 128 символов.
Как это было.
Нашел я наконец-то Лема на польском языке, в формате ворд, обрадовался, но потом думаю - а чем я его буду на Палме читать?
Во-первых, польсифицировал интерфейс (Пайлок)
Во-вторых, попробовал DocumentsToGo. Этот все понимает, если в документе есть только одна кодировка. Приятно было видеть все эти закорючки, но читать в нем - увы и ах
В-третьих, RepliGo - тоже все хорошо, но в нем нет переносов
В-четвертых, вспомнил про BookDesigner. Первая проблема - при считывании html или doc пропадают те самые (сабж) символы. Типа их нет. В ворде они видны, отсюда - нет. Хтмл делался как windows-1251 так и windows-1250. Этот вариант отпадает сразу. После некоторых мучений сделал я fb2, загнал его в BookDesigner - те самые символы заменились на 1251, где англицкие, где русские. То же самое после конвертации на Палме.

В результате я остался с iSilo, который без проблем проглотил html, сохранил форматирование... но в нем нет переносов. Есть ли какой-нить способ заставить BookDesigner понимать документы в 1250, к примеру? Я смогу прочесть и без загогулин, но как-то это некомфортно Sad

Полную поддержку восточно-европейских языков в BD я не делал. В основном, по причине того, что я их не знаю. Частичная же может быть обеспечена следующим образом.
1. Settings:
MultiLanguage support: отмечено
book language: German
2. Загрузить книгу
3. Правый клик - > encoding -> Central Europian (Windows)
 
View user's profile ^

a_lone
Член клуба The eBook

Член клуба The eBook



Joined: 16 Sep 2004
Posts: 1724



Posted: 17.09.2004 11:07    

vvv wrote:

Полную поддержку восточно-европейских языков в BD я не делал. В основном, по причине того, что я их не знаю. Частичная же может быть обеспечена следующим образом.
1. Settings:
MultiLanguage support: отмечено
book language: German
2. Загрузить книгу
3. Правый клик - > encoding -> Central Europian (Windows)


Спасибо за совет, так и сделал - и получил в конце концов почти желаемое... Однако только из XML - в действительности это был файл FB2 c расширением XML. Я так понимаю, что при считывании FB2 применяется иной алгоритм, чем при считывании XML?
Далее - все-таки не все буквы правильны. Скажем, фивти-фивти. Уже лучше, но все же...

Кстати, а почему бы внутри программы не хранить в юникоде книгу? Тогда бы все проблемы ушли - плюс дать пользователю выбрать не просто шрифт, а шрифт с codepage.

Libroom wrote:
Пшепрашем Пана, але не с тего Пан начаул. Smile

Все еще проще! Вам нужно поставить себе программу MobiReader и не зависимо от системы поставить mobitype шрифты, потому что программа будет именно их использовать и совсем без разницы что там в системе.

Поэтому посмотрите посты которые делал Гера по поводу шрифтов mobitype, там есть упоминание о конвертере truetype шрифтов в формат mobitype.


Спасибо, эту программу я как-то не пробовал, но чуствую - нужно Smile
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 17.09.2004 11:19    

Только я не уверен в ответе Валеры. Дело в том, что немецкий алфавит, это не польский. Если в немецком присутствуют такие буквы как:

üéäá и т.д.

то в польском отличительные буквы выглядят, ну и читаются по другому:

ą ó ł ś ć ó ę ż и т.д.

Поэтому лучше использовать специальный шрифт для чтения.

Для тех кому не видны буквы на экране:

 
View user's profile ^

a_lone
Член клуба The eBook

Член клуба The eBook



Joined: 16 Sep 2004
Posts: 1724



Posted: 17.09.2004 13:33    

Может, я что-то не понимаю, однако...

1) Я могу использовать спец шрифт для чтения, однако, гм, я не могу в BookDesigner открыть источник с сохранением этих специфических символов (они заменяются), пробовал и doc, и html, b xml. Может, чем-то другим можно конвертнуть fb2 в pdb? Или doc в fb2, помимо ExportXML.dot (этот в кодировке, отличной от юникода, тоже "конвертит" спец символы), в кодировке windows-1250?

2) С моим предыдущим постом я поспешил - BookDesigner сохраняет в той же кодировке, в моем случае - в UTF8, палма такое, ессно не понимает - имею prc с юникодным текстом. В любом случае не все символы правильно отбражаются.
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 17.09.2004 13:54    

1. Я не понял про FB2 и польский язык... Или уже где-то готовые тексты в ензыку польским?

2. UTF-8 оптимально для Mobireader.

Вообще с польским придется экспериментировать.
 
View user's profile ^

a_lone
Член клуба The eBook

Член клуба The eBook



Joined: 16 Sep 2004
Posts: 1724



Posted: 17.09.2004 15:29    

Libroom wrote:
1. Я не понял про FB2 и польский язык... Или уже где-то готовые тексты в ензыку польским?


Да, есть тексты в формате DOC. Я уже сейчас могу их читать в RepliGo, DocumentsToGo, iSilo - но неудобно, поэтому хочу сконвертировать в ПалмДок. С сохранением форматирования. Но не могу.

Quote:

2. UTF-8 оптимально для Mobireader.

Вообще с польским придется экспериментировать.


Разве Mobireader понимает юникод? Я подсунул ему prc, но юникод так и остался нераскодированным.
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 17.09.2004 16:05    

Извини, забыл добавить, что шрифт тоже должен быть юникод.... пардон! Читаю на сайте:

Note that UTF-8 is currently not supported on PalmOS devices

Так что пардон, действительно, для Пальмы нет.

http://www.mobipocket.com/en/DownloadSoft/ProductDetailsReaderPro.asp? feature=5
 
View user's profile ^

gera_serg
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Joined: 10 Feb 2004
Posts: 310



Posted: 17.09.2004 17:32    

a_lone

Предлагаю попробовать воспользоваться читалкой на Пальме PalmFiction
1. Она сама делает переносы по алгоритму сочетаний гласный - негласный, возможно и в польском переносы будут допустимо выглядеть.
2. На сайте автора есть конвертор сглаженных шрифтов
3. Читает простой TXT, простой PDB, zTXT
4. Если не нужен сглаженный шрифт, используй системные от польского Piloc

Если пришлешь польский ttf шрифт могу попробовать сделать вариант для МобиРидера, но все равно не факт, что BD правильно расставит переносы для польского
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 17.09.2004 21:48    

a_lone wrote:
Может, я что-то не понимаю, однако...

1) Я могу использовать спец шрифт для чтения, однако, гм, я не могу в BookDesigner открыть источник с сохранением этих специфических символов (они заменяются), пробовал и doc, и html, b xml. Может, чем-то другим можно конвертнуть fb2 в pdb? Или doc в fb2, помимо ExportXML.dot (этот в кодировке, отличной от юникода, тоже "конвертит" спец символы), в кодировке windows-1250?

Для чтения можно открыть текст в любой кодировке. А вот правильно сконвертировать в pdb - пока только тексты для языков, включенных в win-1251 и win-1252. Немецкий же язык был рекомендован по причине того, что в нем, в отличие от русского или французского, всего 7 символов в расширенных ASCII. Следовательно, перекрытие с польским будет минимальным.
Видимо, пора делать полную поддержку польского языка (Вы не первый, кто об этом спрашивает, значит - назрело). Но польского я не знаю и здесь мне нужна помошь. И вот в каком плане.
1. Пришлите, пожалуйста, несколько книг на польском.
2. Польский алфавит (символ каждой буквы и ее номер в ASCII и юникодной таблицах).
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 18.09.2004 14:20    

Польских книг у меня нет, к сожалению, а с кодировкой разобрался. Используется кодировка для Windows, Unix, Linux, WWW, mail и terminal одна и таже кодировка – ISO8859-2, таблицу прикладываю ниже.

Code:
Polska Norma dotycząca sposobu kodowania polskich znaków nosi oznaczenie:

PN-93 T-42118

i jest ZGODNA z ISO 8859-2, a więc aby być w zgodzie z Polską Normą należy stosować następujące kodowanie polskich znaków:

  Ą   Ć   Ę   Ł   Ń   Ó   Ś   Ź   Ż 
 161 198 202 163 209 211 166 172 175

  ą   ć   ę   ł   ń   ó   ś   ź   ż 
 177 230 234 179 241 243 182 188 191

Нормальный способ кодирования польских знаков имеет наименование:

PN-93 T-42118

также есть необходимые знаки в кодировке ISO 8859-2... ну и перечислены особенные знаки, отличные от roman.

Если еще нужны какие сведения, спрашивай. Поищу.

 
View user's profile ^

GribUser
Fictionbook.Lib, FB2, Divide&Conquer

Fictionbook.Lib, FB2, Divide&Conquer



Joined: 18 Jun 2003
Posts: 7297


Location: Мордор (северный Гандурас)

Posted: 19.09.2004 21:16    

btw fb2any теперь позволяет экспортить fb2 в текст c любуй кодировкой. А FBTools умеют экспортить в HTML в любой кодировке от рождения, практически. В палмо-пригодный формат пока экспортить нельзя, правда, но makedoc какой-нить можно заюзать. При желании.
 
View user's profile ^

a_lone
Член клуба The eBook

Член клуба The eBook



Joined: 16 Sep 2004
Posts: 1724



Posted: 20.09.2004 18:13    

В общем, получилось все не то чтобы очень просто, но близко к этому понятию.
Из doc формата я сделал html с windows-1250 кодировкой, который, в свою очередь, скормил to TibrConverter. На выходе получил вполне приличный PalmDoc с сохранением форматирования, который одинаково хорошо (ну, почти одинаково хорошо) читается в MobiPocket и в PF. Второй вариант - скормить тот же HTML to MobiPocketPublisher. Результат - почти такой же, кроме всяких напоминаний про необходимость купить про-версию и дополнительных возможностей.
Третий вариант - самый простой, но без форматирования - копируем doc на палму, открываем в DocumentToGo (не ниже 7-ки) и сохраняем в PalmDoc.

Осталось найти шрифты для PF и MobiReader, чтобы не переключать каждый раз Pyloc и иметь красивую картинку Smile
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 20.09.2004 23:50    

Libroom wrote:
Польских книг у меня нет, к сожалению, а с кодировкой разобрался. Используется кодировка для Windows, Unix, Linux, WWW, mail и terminal одна и таже кодировка – ISO8859-2, таблицу прикладываю ниже.

Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка).
 
View user's profile ^

a_lone
Член клуба The eBook

Член клуба The eBook



Joined: 16 Sep 2004
Posts: 1724



Posted: 21.09.2004 01:11    

vvv wrote:

Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка).


Книги на польском - пожалуйста, сколько угодно. Могу переслать (куда?), а можете просто скачать с сайта http://artefact.lib.ru/library/lem.htm
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 21.09.2004 01:18    

a_lone wrote:
vvv wrote:

Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка).


Книги на польском - пожалуйста, сколько угодно. Могу переслать (куда?), а можете просто скачать с сайта http://artefact.lib.ru/library/lem.htm

Спасибо, скачал.
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 21.09.2004 05:19    

Libroom wrote:
Польских книг у меня нет, к сожалению, а с кодировкой разобрался. Используется кодировка для Windows, Unix, Linux, WWW, mail и terminal одна и таже кодировка – ISO8859-2, таблицу прикладываю ниже.

Code:

  Ą    Ć     Ę    Ł     Ń    Ó    Ś    Ź    Ż 
 161 198 202 163 209 211 166 172 175
  ą     ć     ę     ł     ń     ó    ś     ź     ż 
 177 230 234 179 241 243 182 188 191


Ох и нехороший же человек билл, сосиска, сарделька, Навуходоносер и петух гамбургский. Вообщем, у этой американской сосиски-сардельки и т.д. свое понимание польского алфавита (различается в шести следующих буквах)
Code:

  Ą     Ś    Ź 
 165 140 143
  ą     ś     ź   
 185 156 159


А может ты чего напутал, но, зная билла, думаю, что нехороший человек - он.


Last edited by vvv on 21.09.2004 05:43; edited 1 time in total
 
View user's profile ^

vvv
Автор программы BookDesigner

Автор программы BookDesigner



Joined: 18 Jun 2003
Posts: 2690



Posted: 21.09.2004 05:29    

a_lone wrote:
vvv wrote:

Для начала достаточно, переносы уже можно подстроить, спасибо. А затем понадобятся несколько книг на польском в doc-формате (надо будет подстраивать вордовский конвертор, который частенько врет при автоопределении языка).


Книги на польском - пожалуйста, сколько угодно. Могу переслать (куда?), а можете просто скачать с сайта http://artefact.lib.ru/library/lem.htm

Можете попробовать поддержку польского в BD. Скачайте этот файл и распакуйте его в директорию Book Designer 4.0.
http://www.the-ebook.org/e107/e107_files/downloads/bd/BdPolish.zip

Польские книги выглядят на экране BD вот так


Перед загрузкой польских книг надо сделать следующие назначения в Settings:
keep origrnal format: отмечено
MultiLanguage support: отмечено
book language: Polish

Для чтения польских книг на Палм надо ставить соответствующий шрифт. Где искать - не знаю, посмотрите на польских палмовских сайтах. Также можете попросить у Геры редактов шрифтов Моби, взять за основу любой шрифт и дорисовать в соответствующих местах 18 польских букв.

А мне любопытно, много ли багов насажал (особенно в переносах): программировать поддержку языка при полном его незнаниии - это, знаете ли, забавно, что-то сродни мазохизму... Подозреваю, что раньше только билл такое делал Very Happy
 
View user's profile ^

Libroom
Член клуба The eBook

Член клуба The eBook

Donate

Joined: 10 Jun 2003
Posts: 23551



Posted: 21.09.2004 07:36    

vvv wrote:
А мне любопытно, много ли багов насажал (особенно в переносах): программировать поддержку языка при полном его незнаниии - это, знаете ли, забавно, что-то сродни мазохизму... Подозреваю, что раньше только билл такое делал Very Happy

Ну судя по скриншоту, только в одном месте ошибка в переносах, слово "работа" - pracujance... эта буква "А с ножной", читается в конце буквы как "носовая Н". Звучит - "ПРАЦУЁнЦЭ". Так что после этой буквы должен быть перенос.

Сложнее было бы сделать переносы для Чешского языка - мало гласных, много согласных. Например слово "верба", в чешском звучит как "vrba"... попробуй поставить перенос! гыгыгы
 
View user's profile ^
Libroom Forum IndexBook DesignerAll times are GMT + 4 Hours
Goto page 1, 2  Next
Page 1 of 2

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© Libroom, 2021