Author | Message |
---|
acer1976 Guest
| Posted: 04.10.2009 14:06 | |
| Скачал с сайта Букфаст.ру - "Подробная инструкция по конвертации словарей под PocketBook и необходимые для этого инструменты". Скачал словарь с сайта дикт.пдапрайм.ру Города и столицы мира. Делал все по инструкции, единственное конвертацию txt -> txt(UTF8), производил при помощи Shtirlitz IV.
Полученный файл *.dic закачал на Покет.
Далее, на мой взгляд странная работа словаря (запуск из приложений). Например, в словаре есть желание найти город на букуву "м", набираю букву "м" - ничего не происходит. Набираю "мо" появляются города начинающиеся с "мо". Набираю "а" также ничего не происходит, "р" ищет, появляются города на эту букву.
Такое ощущение, что по некоторым буквам ищет, а по некоторым не ищет.
Стандартный словарь, который в поставке с покетом работает корректно.
Вообще все словари (уже готовые в формате *.dic) скачанные с Букфаст.ру работают как выше было описано (т.е. не по всем буквам идет корректный поиск).
PocketBook 301+ Версия ПО Е301.12.7 (на 12.6 было также) приложение словарь из последней прошивки. Память устройства проверял.
Если так и задумано, то не есть респект. Если нет, в чем может быть дело? Заранее спасибо за ответ. |
|
| |
Alex_None Член клуба The eBook
Joined: 20 Apr 2009 Posts: 1578
Location: Киев
| Posted: 05.10.2009 09:56 | |
| acer1976 wrote: | Вообще все словари (уже готовые в формате *.dic) скачанные с Букфаст.ру работают как выше было описано (т.е. не по всем буквам идет корректный поиск). |
Если можно, на конкретных примерах _________________ 301+(32МБ) (301.14.2) -Это интересно! |
|
| |
kolosat Заслуженный участник форума
Joined: 05 Jun 2009 Posts: 231
Location: Житомир, Україна
| Posted: 05.10.2009 12:33 | |
| acer1976 wrote: | Полученный файл *.dic закачал на Покет.
|
если можно выложите результат. _________________ Читая книги электронные, экономим бумагу тоннами! |
|
| |
acer1976 Guest
| Posted: 05.10.2009 19:27 | |
| В качестве примера привожу работу словаря с Букфаст.ру - Большой юридический словарь для PocketBook. открываю приложение словарь, открываю Большой юридический словарь. Набираю - буква "а". В моем понимании работы словаря, должны показаться слова начинающиеся с буквы "а". Этого не происходит.
Затем набираю "н". Т.е. набрано "ан". В этом случае появляется список слов начинающийся с "ан". "Аналитическая юриспруденция" и т.д.
На других буквах и сочетаниях букв ситация аналогичная, где-то идет поиск (как например слова начинающиеся с "ан"), где-то нет.
P.S. вообще удивительно, что до меня такое никто не обнаруживал. Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата). |
|
| |
Alex_None Член клуба The eBook
Joined: 20 Apr 2009 Posts: 1578
Location: Киев
| Posted: 07.10.2009 10:34 | |
| acer1976 wrote: | Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата). |
Думаю, что все воспринимают как должное Такой уж функционал словаря _________________ 301+(32МБ) (301.14.2) -Это интересно! |
|
| |
velakara Искушенный участник форума
Joined: 10 Sep 2009 Posts: 47
| Posted: 09.10.2009 14:54 | |
| Создание словарей - проблема с приставками
Mожно ли в принципе заставить файл morphems преобразовывать приставки (начало слова)? Это необходимо для французских словарей: s'agissait, d'abandonner, l'exploration - здесь нужно обрезать начало. Пробовал всеми способами - не работает, могу менять лишь окончания. |
|
| |
acer1976 Guest
| Posted: 10.10.2009 13:11 | |
| Alex_None wrote: | acer1976 wrote: | Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата). |
Думаю, что все воспринимают как должное Такой уж функционал словаря |
А что скажут по этому поводу уважаемые разработчики. Есть шанс реализовать вышеуказанные пожелания (адекватный поиск в словарях), либо необходимо писать пожелания в какую-то другую ветку? |
|
| |
Aardvark Член клуба The eBook
Joined: 12 Nov 2007 Posts: 2058
Location: Москва
| Posted: 10.10.2009 13:15 | |
| Вероятно, разработчики решили, что слов на одну букву слишком много (список получится длинный), поэтому фильтрацию включают со второй буквы. Не баг, а фича, как говорится. _________________ Onyx Boox Max Carta, Kobo Aura One |
|
| |
velakara Искушенный участник форума
Joined: 10 Sep 2009 Posts: 47
| Posted: 17.11.2009 12:34 | |
| acer1976 wrote: | В качестве примера привожу работу словаря с Букфаст.ру - Большой юридический словарь для PocketBook. открываю приложение словарь, открываю Большой юридический словарь. Набираю - буква "а". В моем понимании работы словаря, должны показаться слова начинающиеся с буквы "а". Этого не происходит.
Затем набираю "н". Т.е. набрано "ан". В этом случае появляется список слов начинающийся с "ан". . |
Это значит, что в .dic словаре проблемы. Не все статьи исходника попали в скомпилированый словарь. Повреждения бывают разной тяжести - бывает, что не ищет аб... но уже открывает ат... Бывает, что обрезается все начало алфавита.
Глючит компилятор - особенно достают его (по моим наблюдениям) двойные фигурные скобки в исходном текстовом файле. Форматированием исходника (убрать скобки, ссылки etc.) можно добиться того, что получится работающий безглючный словарь.
Разработчики компилятора могли бы сделать его постабильнее (чтобы список заголовков не кромсался бы из-за каких-то странностей в тексте статей исходника). |
|
| |
DmitryZ Кандидат в члены клуба The eBook
Joined: 29 Dec 2006 Posts: 295
| Posted: 17.11.2009 22:46 | |
| Со старым конвертером есть проблемы. Вот исправленная версия: http://ifolder.ru/15036863 Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря). |
|
| |
iREn Заслуженный участник форума
Joined: 18 Mar 2009 Posts: 239
| |
| |
Rare Reader Недавний участник форума
Joined: 13 Nov 2009 Posts: 14
| Posted: 23.11.2009 22:03 | |
| DmitryZ wrote: | Со старым конвертером есть проблемы. Вот исправленная версия: http://ifolder.ru/15036863 Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря). |
Если в имени исходного текстового файла используется кириллица, то конвертер вставляет в файл *.dic название словаря в кодировке Win1251, а надо - в UTF-8.
И еще вопрос по теме, в списке выбора словарей отображаются только первые 20 словарей (по алфавиту), остальные файлы игнорируются. Это ограничения прошивки? (Pocketbook 301+ v12.7) |
|
| |
velakara Искушенный участник форума
Joined: 10 Sep 2009 Posts: 47
| Posted: 25.11.2009 09:26 | |
| DmitryZ wrote: | Со старым конвертером есть проблемы. Вот исправленная версия: http://ifolder.ru/15036863 Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря). |
Новый конвертер устраняет кучу проблем - у меня пошли словари которые я уже отчаивался запустить.
Между тем не все гладко. Вот исходники двух русско-русских словарей : http://rapidshare.com/files/311855064/Ishodniki_-_to_check_the_new_con verter.rar
Побегаешь по странице текста и проблемы становятся видны.
В "Литературе", если твой указатель, например, на слове "его" список статей выглядит так: Жаргонизмы ? ?. А. Есенина Екклезиаст
То есть статьи раскалываюстя где-то по середине - кусок битого предложения выглядит как заголовок статьи. Смотришь на саму статью в исходнике - нет видимых проблем. На лигве все идет гладко.
То же самое наблюдалось и в случае старого конвертера в более острой форме (к этому добавлялось исчезновение из списка половины алфавита). |
|
| |
Rare Reader Недавний участник форума
Joined: 13 Nov 2009 Posts: 14
| Posted: 25.11.2009 22:24 | |
| Название любого словаря *.dic, которое отображает Pocketbook, можно исправить следующим способом: 1. Создаем текстовый файл, в нем пишем нужное название словаря. 2. С помощью программы wu8.exe от Alex_None конвертируем этот файл в UTF-8. 3. Открываем для просмотра в виде Hex сконвертированный файл с нужным названием. 4. Открываем словарь *.dic hex-редактором. 5. Начиная со смещения 0x40 побайтно заменяем нечитабельное название на нужное. Есть ограничение на длину названия - максимум 31 символ (со смещения 0x80 идут уже другие данные). Название должно завершаться двумя нулевыми байтами (максимум по смещению 0x7e и 0x7f). Пункт 2 можно сделать и обычным блокнотом, в этом случае при его просмотре в режиме Hex игнорируем первые 3 байта EF BB BF.
Добавлено спустя 36 минут 5 секунд:
Толковый словарь русского языка Ожегова и Шведовой (С.И.Ожегов, Н.Ю.Шведова. Толковый словарь русского языка. Издательство "Азъ";, 1992. OCR Конник М.В.): http://ifolder.ru/15158777
Толковый словарь русского языка под редакцией Д.Н. Ушакова: http://ifolder.ru/15158902 |
|
| |
Antuan Член клуба The eBook
Joined: 30 Sep 2009 Posts: 11643
Location: Киев
| Posted: 26.11.2009 14:25 | |
| Попытался конвертировать словарь Брокгауза, при конвертировании четыре раза выскакивает сообщение о том что мол размер статьи слишком велик, в результате работоспособной оказывается только вторая половина словаря. Как избежать такого, может надо как-то подправить те статьи которые оказались не по зубам конвертеру? Зачем вообще введено ограничение на размер словарной статьи? Мучил вот этот словарь: http://dict.pocketz.ru/files/Brz_Efn.zd _________________ PB 360° (v.15.3) | PB Pro 602 Grey (v.2.2.1a fastdrv) | PB A7 (v.1.3.1583) - подарок от PocketBook. |
|
| |
Rare Reader Недавний участник форума
Joined: 13 Nov 2009 Posts: 14
| Posted: 26.11.2009 21:10 | |
| 1. Новый толково-словообразовательный словарь русского языка под ред. Ефремовой: http://ifolder.ru/15174331 Некорректный поиск: набираем "прит", отображается "прыть", хотя есть слова на "прит", и они отображаются при простом листании словаря. Исходник: http://www.alreader.com/dict/harvester/Efremova.zd
2. В исходнике http://dict.pdaprime.ru/file.php?n=ojogv.zd статься "стайка <= стая", а в словаре просто название статьи "стайка" без текста статьи. А если в исходнике *.xdrf http://downloads.sourceforge.net/xdxf/comn_dictd04_ozhegov.tar.bz2 статья в виде <ar><k>стайка</k> стайка <= стая</ar> то она отображается правильно. Зато в этом словаре присутствуют ненужные разрывы строк, в результате чего нерационально расходуется место на экране.
3. Берем те же исходники, что и в п.2. Статья "Книга". Здесь наоборот - в первом варианте все правильно, а во втором - таких статей несколько - потеряна самая первая ("Книга - крупное подразделение литературного произведения, состоящее из многих глав").
4. При использовании старого конвертора, поле "Перевод" в словаре расположено сразу над виртуальной клавиатурой. При использовании нового - между ними еще пустое поле, высота которого почти как виртуальная клавиатура - занимает много лишнего места на экране.
Добавлено спустя 1 час 10 минут 1 секунду:
Rare Reader wrote: | Есть ограничение на длину названия - максимум 31 символ (со смещения 0x80 идут уже другие данные). Название должно завершаться двумя нулевыми байтами (максимум по смещению 0x7e и 0x7f). |
Длину названия можно увеличить, заменив в нем буквы кириллицы соответствующими буквами латиницы. В кодировке UTF-8 символ кириллицы занимает 2 байта, символ латиницы - 1 байт. У меня все мои словари отображаются в нужном виде (в том числе "Большой энциклопедический словарь" . |
|
| |
xyz Зрелый участник форума
Joined: 23 Sep 2009 Posts: 28
Location: Новосибирск
| Posted: 27.11.2009 07:58 | |
| Rare Reader wrote: | ... Длину названия можно увеличить, заменив в нем буквы кириллицы соответствующими буквами латиницы. В кодировке UTF-8 символ кириллицы занимает 2 байта, символ латиницы - 1 байт. У меня все мои словари отображаются в нужном виде (в том числе "Большой энциклопедический словарь" ;). |
Суррогатное представление в чужом алфавите трудно назвать "нужным видом" :( _________________ PocketBook 360° + 4G |
|
| |
Rare Reader Недавний участник форума
Joined: 13 Nov 2009 Posts: 14
| Posted: 27.11.2009 08:13 | |
| Может я не очень понятно выразился, у меня отображается "Большой энциклопедический словарь" - 2-я и 3-я буквы с конца "ap" - это буквы латинского алфавита "эй" и "пи". Это выглядит гораздо менее суррогатным, чем "Большой энциклопедический словар", и тем более, "Большой энциклопедический словарр?#". |
|
| |
Rare Reader Недавний участник форума
Joined: 13 Nov 2009 Posts: 14
| Posted: 27.11.2009 21:15 | |
| Большой энциклопедический словарь (benc.dic) с bookfast.org не ищет словосочетания (нет в словаре), которые начинаются на: "великая", "сибирская", "гражданская", хотя есть "великие...", "сибирские...", "гражданские...". У всех так? |
|
| |
Alex_None Член клуба The eBook
Joined: 20 Apr 2009 Posts: 1578
Location: Киев
| Posted: 29.11.2009 20:23 | |
| Rare Reader wrote: | Большой энциклопедический словарь (benc.dic) с bookfast.org не ищет словосочетания (нет в словаре), которые начинаются на: "великая", "сибирская", "гражданская", хотя есть "великие...", "сибирские...", "гражданские...". У всех так? |
Да, так. В новой версии конвертера дела со словарями обстоят несколько лучше (но еще далеко до идеала). Вот новая версия Большого энциклопедического словаря http://rapidshare.com/files/313884232/benc.dic
Posted after 3 hours 55 minutes 1 second:
Предлагаю новую 3-ю версию пака для создания/модификации словарей (7МБ). http://rapidshare.com/files/314139280/DicConverter3_3.zip или http://ifolder.ru/15665685
В новую версию включен обновленный конвертер, все необходимые утилиты для конвертации, обучающее видео.
Также добавлена программа DicRename собственного производства, позволяющая легко давать новое имя уже существующему словарю. Так что кто был недоволен именами типа FEng_Rus_full в списке словарей- теперь сможете обозвать такой словарь как вашей душе угодно
Для работы программ wu8 и DicRename требуется библиотека .NET Framework 2.0 - 23МБ (файл dotnetfix.exe- скачать и установить) _________________ 301+(32МБ) (301.14.2) -Это интересно!
Last edited by Alex_None on 26.12.2009 00:02; edited 1 time in total |
|
| |