Создание и использование словарей (поиск в словарях)
Goto page 1, 2, 3 ... 64, 65, 66  Next
 
Libroom Forum IndexPocketBookPocketBook с экраном E-Ink
AuthorMessage

acer1976
Guest









Posted: 04.10.2009 14:06    

Скачал с сайта Букфаст.ру - "Подробная инструкция по конвертации словарей под PocketBook и необходимые для этого инструменты".
Скачал словарь с сайта дикт.пдапрайм.ру Города и столицы мира.
Делал все по инструкции, единственное конвертацию txt -> txt(UTF8), производил при помощи Shtirlitz IV.

Полученный файл *.dic закачал на Покет.

Далее, на мой взгляд странная работа словаря (запуск из приложений).
Например, в словаре есть желание найти город на букуву "м", набираю букву "м" - ничего не происходит. Набираю "мо" появляются города начинающиеся с "мо".
Набираю "а" также ничего не происходит, "р" ищет, появляются города на эту букву.

Такое ощущение, что по некоторым буквам ищет, а по некоторым не ищет.

Стандартный словарь, который в поставке с покетом работает корректно.

Вообще все словари (уже готовые в формате *.dic) скачанные с Букфаст.ру работают как выше было описано (т.е. не по всем буквам идет корректный поиск).

PocketBook 301+
Версия ПО Е301.12.7 (на 12.6 было также)
приложение словарь из последней прошивки.
Память устройства проверял.

Если так и задумано, то не есть респект. Если нет, в чем может быть дело?
Заранее спасибо за ответ.
 
^

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

Posted: 05.10.2009 09:56    

acer1976 wrote:
Вообще все словари (уже готовые в формате *.dic) скачанные с Букфаст.ру работают как выше было описано (т.е. не по всем буквам идет корректный поиск).

Если можно, на конкретных примерах
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
View user's profile ^

kolosat
Заслуженный участник форума

Заслуженный участник форума



Joined: 05 Jun 2009
Posts: 231


Location: Житомир, Україна

Posted: 05.10.2009 12:33    

acer1976 wrote:

Полученный файл *.dic закачал на Покет.

если можно выложите результат.
_________________
Читая книги электронные,
экономим бумагу тоннами!
 
View user's profile ^

acer1976
Guest









Posted: 05.10.2009 19:27    

В качестве примера привожу работу словаря с Букфаст.ру - Большой юридический словарь для PocketBook.
открываю приложение словарь, открываю Большой юридический словарь.
Набираю - буква "а".
В моем понимании работы словаря, должны показаться слова начинающиеся с буквы "а".
Этого не происходит.

Затем набираю "н". Т.е. набрано "ан". В этом случае появляется список слов начинающийся с "ан".
"Аналитическая юриспруденция" и т.д.

На других буквах и сочетаниях букв ситация аналогичная, где-то идет поиск (как например слова начинающиеся с "ан"), где-то нет.

P.S. вообще удивительно, что до меня такое никто не обнаруживал. Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата).
 
^

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

Posted: 07.10.2009 10:34    

acer1976 wrote:
Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата).

Думаю, что все воспринимают как должное Wink
Такой уж функционал словаря
_________________
301+(32МБ) (301.14.2) -Это интересно!
 
View user's profile ^

velakara
Искушенный участник форума

Искушенный участник форума



Joined: 10 Sep 2009
Posts: 47



Posted: 09.10.2009 14:54    

Создание словарей - проблема с приставками

Mожно ли в принципе заставить файл morphems преобразовывать приставки (начало слова)?
Это необходимо для французских словарей: s'agissait, d'abandonner, l'exploration - здесь нужно обрезать начало.
Пробовал всеми способами - не работает, могу менять лишь окончания.
 
View user's profile ^

acer1976
Guest









Posted: 10.10.2009 13:11    

Alex_None wrote:
acer1976 wrote:
Т.е. либо все это воспринимают как должное, либо проблема с моим девайсом (в частности точно знаю, что у моего покета проблема с часами после суток простоя - сбрасываются часы и дата).

Думаю, что все воспринимают как должное Wink
Такой уж функционал словаря


А что скажут по этому поводу уважаемые разработчики. Есть шанс реализовать вышеуказанные пожелания (адекватный поиск в словарях), либо необходимо писать пожелания в какую-то другую ветку?
 
^

Aardvark
Член клуба The eBook

Член клуба The eBook



Joined: 12 Nov 2007
Posts: 2058


Location: Москва

Posted: 10.10.2009 13:15    

Вероятно, разработчики решили, что слов на одну букву слишком много (список получится длинный), поэтому фильтрацию включают со второй буквы. Не баг, а фича, как говорится.
_________________
Onyx Boox Max Carta, Kobo Aura One
 
View user's profile ^

velakara
Искушенный участник форума

Искушенный участник форума



Joined: 10 Sep 2009
Posts: 47



Posted: 17.11.2009 12:34    

acer1976 wrote:
В качестве примера привожу работу словаря с Букфаст.ру - Большой юридический словарь для PocketBook.
открываю приложение словарь, открываю Большой юридический словарь.
Набираю - буква "а".
В моем понимании работы словаря, должны показаться слова начинающиеся с буквы "а".
Этого не происходит.

Затем набираю "н". Т.е. набрано "ан". В этом случае появляется список слов начинающийся с "ан". .


Это значит, что в .dic словаре проблемы. Не все статьи исходника попали в скомпилированый словарь. Повреждения бывают разной тяжести - бывает, что не ищет аб... но уже открывает ат... Бывает, что обрезается все начало алфавита.

Глючит компилятор - особенно достают его (по моим наблюдениям) двойные фигурные скобки в исходном текстовом файле. Форматированием исходника (убрать скобки, ссылки etc.) можно добиться того, что получится работающий безглючный словарь.

Разработчики компилятора могли бы сделать его постабильнее (чтобы список заголовков не кромсался бы из-за каких-то странностей в тексте статей исходника).
 
View user's profile ^

DmitryZ
Кандидат в члены клуба The eBook

Кандидат в члены клуба The eBook



Joined: 29 Dec 2006
Posts: 295



Posted: 17.11.2009 22:46    

Со старым конвертером есть проблемы. Вот исправленная версия:
http://ifolder.ru/15036863
Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря).
 
View user's profile ^

iREn
Заслуженный участник форума

Заслуженный участник форума



Joined: 18 Mar 2009
Posts: 239



Posted: 22.11.2009 20:22    

Испанско-русский словарь http://www.fileden.com/files/2009/4/26/2419527/spa_rus_sadikov.dic
 
View user's profile ^

Rare Reader
Недавний участник форума

Недавний участник форума



Joined: 13 Nov 2009
Posts: 14



Posted: 23.11.2009 22:03    

DmitryZ wrote:
Со старым конвертером есть проблемы. Вот исправленная версия:
http://ifolder.ru/15036863
Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря).

Если в имени исходного текстового файла используется кириллица, то конвертер вставляет в файл *.dic название словаря в кодировке Win1251, а надо - в UTF-8.

И еще вопрос по теме, в списке выбора словарей отображаются только первые 20 словарей (по алфавиту), остальные файлы игнорируются. Это ограничения прошивки? (Pocketbook 301+ v12.7)
 
View user's profile ^

velakara
Искушенный участник форума

Искушенный участник форума



Joined: 10 Sep 2009
Posts: 47



Posted: 25.11.2009 09:26    

DmitryZ wrote:
Со старым конвертером есть проблемы. Вот исправленная версия:
http://ifolder.ru/15036863
Просьба потестить, если найдете еще какие проблемы - пишите в этой теме (желательно сразу со ссылкой на исходник словаря).


Новый конвертер устраняет кучу проблем - у меня пошли словари которые я уже отчаивался запустить.

Между тем не все гладко. Вот исходники двух русско-русских словарей : http://rapidshare.com/files/311855064/Ishodniki_-_to_check_the_new_con verter.rar

Побегаешь по странице текста и проблемы становятся видны.

В "Литературе", если твой указатель, например, на слове "его" список статей выглядит так:
Жаргонизмы ?
?. А. Есенина
Екклезиаст


То есть статьи раскалываюстя где-то по середине - кусок битого предложения выглядит как заголовок статьи. Смотришь на саму статью в исходнике - нет видимых проблем. На лигве все идет гладко.

То же самое наблюдалось и в случае старого конвертера в более острой форме (к этому добавлялось исчезновение из списка половины алфавита).
 
View user's profile ^

Rare Reader
Недавний участник форума

Недавний участник форума



Joined: 13 Nov 2009
Posts: 14



Posted: 25.11.2009 22:24    

Название любого словаря *.dic, которое отображает Pocketbook, можно исправить следующим способом:
1. Создаем текстовый файл, в нем пишем нужное название словаря.
2. С помощью программы wu8.exe от Alex_None конвертируем этот файл в UTF-8.
3. Открываем для просмотра в виде Hex сконвертированный файл с нужным названием.
4. Открываем словарь *.dic hex-редактором.
5. Начиная со смещения 0x40 побайтно заменяем нечитабельное название на нужное.
Есть ограничение на длину названия - максимум 31 символ (со смещения 0x80 идут уже другие данные). Название должно завершаться двумя нулевыми байтами (максимум по смещению 0x7e и 0x7f).
Пункт 2 можно сделать и обычным блокнотом, в этом случае при его просмотре в режиме Hex игнорируем первые 3 байта EF BB BF.

Добавлено спустя 36 минут 5 секунд:

Толковый словарь русского языка Ожегова и Шведовой (С.И.Ожегов, Н.Ю.Шведова. Толковый словарь русского языка. Издательство "Азъ";, 1992. OCR Конник М.В.): http://ifolder.ru/15158777

Толковый словарь русского языка под редакцией Д.Н. Ушакова: http://ifolder.ru/15158902
 
View user's profile ^

Antuan
Член клуба The eBook

Член клуба The eBook



Joined: 30 Sep 2009
Posts: 11643


Location: Киев

Posted: 26.11.2009 14:25    

Попытался конвертировать словарь Брокгауза, при конвертировании четыре раза выскакивает сообщение о том что мол размер статьи слишком велик, в результате работоспособной оказывается только вторая половина словаря. Как избежать такого, может надо как-то подправить те статьи которые оказались не по зубам конвертеру? Зачем вообще введено ограничение на размер словарной статьи?
Мучил вот этот словарь:
http://dict.pocketz.ru/files/Brz_Efn.zd
_________________
PB 360° (v.15.3) | PB Pro 602 Grey (v.2.2.1a fastdrv) | PB A7 (v.1.3.1583) - подарок от PocketBook.
 
View user's profile ^

Rare Reader
Недавний участник форума

Недавний участник форума



Joined: 13 Nov 2009
Posts: 14



Posted: 26.11.2009 21:10    

1. Новый толково-словообразовательный словарь русского языка под ред. Ефремовой: http://ifolder.ru/15174331
Некорректный поиск: набираем "прит", отображается "прыть", хотя есть слова на "прит", и они отображаются при простом листании словаря.
Исходник: http://www.alreader.com/dict/harvester/Efremova.zd

2. В исходнике http://dict.pdaprime.ru/file.php?n=ojogv.zd статься "стайка <= стая", а в словаре просто название статьи "стайка" без текста статьи. А если в исходнике *.xdrf http://downloads.sourceforge.net/xdxf/comn_dictd04_ozhegov.tar.bz2 статья в виде
<ar><k>стайка</k>
стайка
&lt;= стая</ar>
то она отображается правильно. Зато в этом словаре присутствуют ненужные разрывы строк, в результате чего нерационально расходуется место на экране.

3. Берем те же исходники, что и в п.2. Статья "Книга". Здесь наоборот - в первом варианте все правильно, а во втором - таких статей несколько - потеряна самая первая
("Книга - крупное подразделение литературного произведения, состоящее из многих глав").

4. При использовании старого конвертора, поле "Перевод" в словаре расположено сразу над виртуальной клавиатурой. При использовании нового - между ними еще пустое поле, высота которого почти как виртуальная клавиатура - занимает много лишнего места на экране.

Добавлено спустя 1 час 10 минут 1 секунду:

Rare Reader wrote:
Есть ограничение на длину названия - максимум 31 символ (со смещения 0x80 идут уже другие данные). Название должно завершаться двумя нулевыми байтами (максимум по смещению 0x7e и 0x7f).

Длину названия можно увеличить, заменив в нем буквы кириллицы соответствующими буквами латиницы. В кодировке UTF-8 символ кириллицы занимает 2 байта, символ латиницы - 1 байт. У меня все мои словари отображаются в нужном виде (в том числе "Большой энциклопедический словарь" Wink.
 
View user's profile ^

xyz
Зрелый участник форума

Зрелый участник форума



Joined: 23 Sep 2009
Posts: 28


Location: Новосибирск

Posted: 27.11.2009 07:58    

Rare Reader wrote:
...
Длину названия можно увеличить, заменив в нем буквы кириллицы соответствующими буквами латиницы. В кодировке UTF-8 символ кириллицы занимает 2 байта, символ латиницы - 1 байт. У меня все мои словари отображаются в нужном виде (в том числе "Большой энциклопедический словарь" ;).


Суррогатное представление в чужом алфавите трудно назвать "нужным видом" :(
_________________
PocketBook 360° + 4G
 
View user's profile ^

Rare Reader
Недавний участник форума

Недавний участник форума



Joined: 13 Nov 2009
Posts: 14



Posted: 27.11.2009 08:13    

Может я не очень понятно выразился, у меня отображается "Большой энциклопедический словарь" - 2-я и 3-я буквы с конца "ap" - это буквы латинского алфавита "эй" и "пи". Это выглядит гораздо менее суррогатным, чем "Большой энциклопедический словар", и тем более, "Большой энциклопедический словарр?#".
 
View user's profile ^

Rare Reader
Недавний участник форума

Недавний участник форума



Joined: 13 Nov 2009
Posts: 14



Posted: 27.11.2009 21:15    

Большой энциклопедический словарь (benc.dic) с bookfast.org не ищет словосочетания (нет в словаре), которые начинаются на: "великая", "сибирская", "гражданская", хотя есть "великие...", "сибирские...", "гражданские...". У всех так?
 
View user's profile ^

Alex_None
Член клуба The eBook

Член клуба The eBook



Joined: 20 Apr 2009
Posts: 1578


Location: Киев

Posted: 29.11.2009 20:23    

Rare Reader wrote:
Большой энциклопедический словарь (benc.dic) с bookfast.org не ищет словосочетания (нет в словаре), которые начинаются на: "великая", "сибирская", "гражданская", хотя есть "великие...", "сибирские...", "гражданские...". У всех так?

Да, так. В новой версии конвертера дела со словарями обстоят несколько лучше (но еще далеко до идеала).
Вот новая версия Большого энциклопедического словаря
http://rapidshare.com/files/313884232/benc.dic

Posted after 3 hours 55 minutes 1 second:

Предлагаю новую 3-ю версию пака для создания/модификации словарей (7МБ).
http://rapidshare.com/files/314139280/DicConverter3_3.zip
или
http://ifolder.ru/15665685

В новую версию включен обновленный конвертер, все необходимые утилиты для конвертации, обучающее видео.

Также добавлена программа DicRename собственного производства, позволяющая легко давать новое имя уже существующему словарю.
Так что кто был недоволен именами типа FEng_Rus_full в списке словарей- теперь сможете обозвать такой словарь как вашей душе угодно Cool

Для работы программ wu8 и DicRename требуется библиотека .NET Framework 2.0 - 23МБ (файл dotnetfix.exe- скачать и установить)
_________________
301+(32МБ) (301.14.2) -Это интересно!


Last edited by Alex_None on 26.12.2009 00:02; edited 1 time in total
 
View user's profile ^
Libroom Forum IndexPocketBookPocketBook с экраном E-InkAll times are GMT + 4 Hours
Goto page 1, 2, 3 ... 64, 65, 66  Next
Page 1 of 66

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© Libroom, 2021