Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

26 Ноябрь 2020, 01:00 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
Новости: Здесь можно поблагодарить участников форума Улыбка
 
   Начало   Помощь Поиск Войти Регистрация    задать вопрос  
Страниц: « 1 2 3 4 5 6 »   Вниз
  Печать  
Автор Тема: Каких слов не хватает в орфографическом словаре?  (Прочитано 57373 раз)
0 Пользователей и 1 Гость смотрят эту тему.
PiVV
Гость
« Ответ #60: 18 Июнь 2010, 19:25 »

prof-alexТрио
Спасибо, но я имел в виду что-то типа этого, но для OOo.
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 547


WWW
« Ответ #61: 19 Июнь 2010, 09:59 »

Библиотека unoil.jar
com.sun.star.linguistic2.

http://api.openoffice.org/docs/common/ref/com/sun/star/linguistic2/SpellChecker
Записан

Yakov
Администратор
**
Offline Offline

Сообщений: 2 547


WWW
« Ответ #62: 19 Июнь 2010, 13:17 »

Документация с примерами использования спеллчекера:
http://wiki.services.openoffice.org/wiki/Documentation/DevGuide/OfficeDev/Using_Spellchecker
Записан

PiVV
Гость
« Ответ #63: 19 Июнь 2010, 14:02 »

Yakov
Спасибо, будем разбираться.
Записан
Рыбка Рио
Форумчанин
***
Offline Offline

Сообщений: 1 678


« Ответ #64: 20 Июнь 2010, 16:53 »

Причина была в  том, что Hunspell не понимает файл аффиксов Ispell
После конвертации всё замечательно работает!!!  Подмигивающий
dict_ru_RU-rk-0.4.oxt (983.29 Кб - загружено 2 раз.)
Так что, давайте может этот словарь будем поставлять со сборкой? Но, кстати, в этом словаре 322147 строк (в обычном словаре порядка 140000 строк), т.е. видимо файл aff в dict_ru_RU-rk-0.4.oxt неоптимален. Наверное, это самая большая сложность, написать файл aff. Словарь dict_ru_RU-rk-0.4.oxt работает в 2 раза дольше (на том специаьном тестовом коде, который тут привели dr.Faust) (при том, что оба словаря - koi8-r).
Записан

ubuntu 12.04 + LibO3.6.0
PiVV
Гость
« Ответ #65: 20 Июнь 2010, 18:31 »

О, господи! Ну какой к чертям собачьим тестовый код? Три десятка слов для словаря в несколько миллионов - это тест? Я понимаю сравнить эффективность простого списка слов и его же, но с использованием аффикс-правил. И вообще, для теста необходимо использовать функцию проверки слова, которая просто проверяет есть такое слово в словаре или нет, но не пытается подбирать для неправильных слов подсказки-суггестии. Вот тогда это более-менее равное сравнение. Ну и тест-слова надо увеличить.
Записан
dr.Faust
Администратор
**
Offline Offline

Пол: Мужской
Расположение: Ростов-на-Дону
Сообщений: 1 340


« Ответ #66: 20 Июнь 2010, 19:22 »

Три десятка слов для словаря в несколько миллионов - это тест?
А какая разница?
И вообще, для теста необходимо использовать функцию проверки слова, которая просто проверяет есть такое слово в словаре или нет, но не пытается подбирать для неправильных слов подсказки-суггестии.
Почему? В реальности он же будет их подбирать. Смысл от теста в условиях которых не будет ни когда?
Ну и тест-слова надо увеличить.
Дык увеличьте. Или дайте список - сам сделаю.
Записан

Свобода информации - свобода личности!
PiVV
Гость
« Ответ #67: 20 Июнь 2010, 20:20 »

Цитата:
А какая разница?
Просто высказываю свои сомнения в правильности и эффективности.
Цитата:
Почему? В реальности он же будет их подбирать. Смысл от теста в условиях которых не будет ни когда?
Ну если уж зашёл разговор о реальности, может тогда какую-нибудь "Войну и мир" взять (а вообще тот макрос можно переделать для проверки файла или текущего текста в редакторе?).
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 547


WWW
« Ответ #68: 20 Июнь 2010, 21:09 »

Так что, давайте может этот словарь будем поставлять со сборкой? Но, кстати, в этом словаре 322147 строк (в обычном словаре порядка 140000 строк), т.е. видимо файл aff в dict_ru_RU-rk-0.4.oxt неоптимален. Наверное, это самая большая сложность, написать файл aff. Словарь dict_ru_RU-rk-0.4.oxt работает в 2 раза дольше (на том специаьном тестовом коде, который тут привели dr.Faust) (при том, что оба словаря - koi8-r).
Этот словарь под лицензией GPL, а для сборки желательна лицензия LGPL.
И ещё один важный момент - этот словарь без буквы Ё (то есть слова, написанные через ё считаются ошибочными). А для сборки хотелось бы иметь словарь с Ё.
Я affix файл полностью переписал под стандарт Hunspell (а старый код ispell закомментировал).
Используется в нём 11 групп суффиксов. Так что написать affix файл не такая большая сложность, сложно сделать оптимальный affix - файл.
Для оптимизации словаря в affix файле можно ещё выделить приставки, тогда основной словарь будет меньше.
Записан

Рыбка Рио
Форумчанин
***
Offline Offline

Сообщений: 1 678


« Ответ #69: 20 Июнь 2010, 21:26 »

Да, тут не только суффиксы и приставки, тут вообще приставки в шировком смысле слова, т.е., к примеру, слово
жи, плы
и производные:
живу, плыву, живущий, плывущий и т.д.
Это не те суффиксы и префиксы, просто приставки с основным формам, и не важно вначале они или в конце.

А по поводу тестового кода, достаточно рассмотреть два случая, 1) взять одно правильное слово, и 2) одно неправильное слово. 1) Правильное слово нужно искать за, к пример, 1000 проходов (т.к. одно слово ищется очень быстро, и скорость поиска зависит от количества букв), а 2) второе слово достаточно искать всего за 10-50 проходов. И сравнить. В тестовом коде время определяется только поиском неправильных слов. Скорее всего , время на поиск правильных слов (для этого нужно немного изменить массив проверяемых слов в коде) будет тоже не в пользу словаря с длинным списком слов в файле dic.
Записан

ubuntu 12.04 + LibO3.6.0
dr.Faust
Администратор
**
Offline Offline

Пол: Мужской
Расположение: Ростов-на-Дону
Сообщений: 1 340


« Ответ #70: 21 Июнь 2010, 01:08 »

Ну если уж зашёл разговор о реальности, может тогда какую-нибудь "Войну и мир" взять (а вообще тот макрос можно переделать для проверки файла или текущего текста в редакторе?).
Влёгкую. Но тестировать надо бы на одном наборе слов...
Записан

Свобода информации - свобода личности!
Yakov
Администратор
**
Offline Offline

Сообщений: 2 547


WWW
« Ответ #71: 21 Июнь 2010, 15:20 »

Могу предложить ещё один словарь http://sisyphus.ru/ru/srpm/Sisyphus/ispell-ru-rk.
Сборка для OpenOffice  переделана из формата ispell, распространяется под GPL v2.
После конвертации всё замечательно работает!!!  Подмигивающий
Разместил
http://extensions.services.openoffice.org/ru/project/Russian-rk-dictionary
Записан

Yakov
Администратор
**
Offline Offline

Сообщений: 2 547


WWW
« Ответ #72: 28 Июнь 2010, 09:10 »

В списке рассылки oo-discuss@
после публкации анонса
http://lists.openoffice.ru/pipermail/oo-discuss/2010-June/022831.html
развернулась дискуссия, почему в словаре нет буквы Ё.
Записан

Syzygy
Форумчанин
***
Offline Offline

Пол: Мужской
Расположение: Подмосковье
Сообщений: 1 522


WWW
« Ответ #73: 28 Июнь 2010, 09:27 »

о есть слова, написанные через ё считаются ошибочными
Это конечно совершенно неправильно.
Записан

A Matter of Life and Death
Yakov
Администратор
**
Offline Offline

Сообщений: 2 547


WWW
« Ответ #74: 28 Июнь 2010, 09:49 »

о есть слова, написанные через ё считаются ошибочными
Это конечно совершенно неправильно.
Меня это тоже не устраивает.
Записан

Страниц: « 1 2 3 4 5 6 »   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!