Полнотекстовой поиск

 
Libroom Forum IndexQumo
AuthorMessage

v0vak
Новенький участник форума

Новенький участник форума



Joined: 19 Sep 2011
Posts: 6



Posted: 19.09.2011 08:25    

Здравствуйте!

Планирую приобрести читалку с qwerty-клавиатурой. Главное что требуется - наличие быстрой и мощной системы поиска по тексту в одном файле или в группе файлов (скажем в папке). В идеале - быстрый полнотекстовой поиск с предварительным индексированием файлов. Это реализовано, скажем в Libro II?
 
View user's profile ^

Dimitry.
Зрелый участник форума

Зрелый участник форума



Joined: 21 Jun 2011
Posts: 34



Posted: 19.09.2011 14:30    

v0vak wrote:
Это реализовано, скажем в Libro II?


В таком объеме - нет. Есть поиск по имени файла, и есть поиск по тексту в открытом файле. Всё. Никакого поиска по многим файлам, тем более, никакой индексации.

Кроме того, при поиске с русскими буквами надо учесть, что при вводе с клавиатуры вместо маленькой русской буквы "с", печатается "c" английское. Впрочем, можно печатать строку поиска большими буквами, поиск в любом случае не зависит от регистра, а большая русская "С" печатается нормально.
 
View user's profile ^

v0vak
Новенький участник форума

Новенький участник форума



Joined: 19 Sep 2011
Posts: 6



Posted: 21.09.2011 05:35    

У электронной читалки есть важная функция, принципиально и качественно отличающая ее от любого бумажного носителя - это возможность быстрого электронного поиска, наряду с компактностью это черезвычайно полезное свойство, скажем для студента. Странно, что производители эту возможность не особо стремятся углубить и расширить, функционал полнотекстового поиска с индексацией для читалки с большой флешкой был бы весьма кстати. Во всяком случае для меня это значительно важнее игр и TTS. Остается надежда что со временем удастся скомпилировать и адаптировать под читалку какой-нибудь из существующих движков благо под линукс их написано уже немало..
 
View user's profile ^

Jivatman
Заслуженный участник форума

Заслуженный участник форума



Joined: 10 Sep 2009
Posts: 263


Location: Moscow

Posted: 21.09.2011 16:06    

При мощности процов современных книжек такой поиск будет приемлемо работать только если файлов будет несколько штук... А если несколько тысяч (флешка-то большая может быть)?... Пока найдешь, аккумулятор сядет... Да еще и идексировать - небыстро это... Проще искать на большом брате или в тырнете... А так - внутри открытого файла - пожалуйста...
... Правда индексировать, наверное, можно и на большом брате... В общем в словарях поиск работает довольно быстро... но это только словари...
_________________
Digma q1000.
 
View user's profile ^

v0vak
Новенький участник форума

Новенький участник форума



Joined: 19 Sep 2011
Posts: 6



Posted: 22.09.2011 08:57    

без поиска по группе файлов легко обойтись. а вот поиск ВНУТРИ документа по нечеткому запросу был бы крайне полезен. Например как в гугле: ввожу в строке поиска "казахстан иммиграция закон принят" а мне находит: "Эмиграция граждан Казахстана после принятия нового эмиграционного закона". И при этом быстро - в течение нескольких секунд. Если для этого надо предварительно двухмегабайтный fb2 проиндексировать на "большом брате", то не беда. Но что-то подсказывает, что максимум минут за 10 с этой задачей и проц читалки справится.

PS Кстати вот тут http://ru.wikipedia.org/wiki/StarDict пишут что StarDict может обрабатывать некие "нечеткие запросы" - это что такое интересно?
 
View user's profile ^

Jivatman
Заслуженный участник форума

Заслуженный участник форума



Joined: 10 Sep 2009
Posts: 263


Location: Moscow

Posted: 22.09.2011 10:50    

v0vak wrote:
без поиска по группе файлов легко обойтись. а вот поиск ВНУТРИ документа по нечеткому запросу был бы крайне полезен. Например как в гугле: ввожу в строке поиска "казахстан иммиграция закон принят" а мне находит: "Эмиграция граждан Казахстана после принятия нового эмиграционного закона". И при этом быстро - в течение нескольких секунд. Если для этого надо предварительно двухмегабайтный fb2 проиндексировать на "большом брате", то не беда. Но что-то подсказывает, что максимум минут за 10 с этой задачей и проц читалки справится.

PS Кстати вот тут http://ru.wikipedia.org/wiki/StarDict пишут что StarDict может обрабатывать некие "нечеткие запросы" - это что такое интересно?

Наверное, вам все-таки лучше ноутбук или нетбук приобрести... На худой конец какую-нибудь таблетку... Книжка хороша именно как книжка, а не как компьютер... А пример вашего запроса - это вообще к системе "Консультант" или "Гарант"...
...Немало людей эти системы разрабатывают и сопровождают...
А словари - работают, и как раз на основе StarDict... Но как словари, а не базы данных... Нечеткость в данном случае сводится лишь к похожести двух слов... ("алгоритм Левенштейна для подсчёта похожести двух слов").
Но если вы будете книжкой пользоваться в нормальном помещении - с точкой доступа, то можете просто пользоваться поисковиками через вифи - и быстрей и проще получится...
p.s. "долгоживучесть" книжки от одного заряда очень сильно зависит от загрузки процессора\памяти... При интенсивном поиске будет книжка работать не дольше таблетки...
_________________
Digma q1000.
 
View user's profile ^
Libroom Forum IndexQumoAll times are GMT + 4 Hours
Page 1 of 1

 
Jump to:  
You cannot post new topics in this forum
You cannot reply to topics in this forum
You cannot edit your posts in this forum
You cannot delete your posts in this forum
You cannot vote in polls in this forum

© Libroom, 2021