Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

28 Февраль 2020, 11:49 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
Новости: Здесь можно поблагодарить участников форума Улыбка
 
   Начало   Помощь Поиск Войти Регистрация    задать вопрос  
Страниц: « 1 2 3 4 5 6   Вниз
  Печать  
Автор Тема: Конвертация словаря в формат Hunspell  (Прочитано 75392 раз)
0 Пользователей и 2 Гостей смотрят эту тему.
cross1983
Новичок
*
Offline Offline

Сообщений: 1


« Ответ #75: 30 Март 2019, 13:19 »

Добрый день. Словарь "только ё" допускает написание "девчёнка" и "девчонка".  Слово "девчёнка" - ошибка.
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 482


WWW
« Ответ #76: 1 Апрель 2019, 08:44 »

Согласен.
Записан

pager_sadly
Новичок
*
Offline Offline

Сообщений: 1


« Ответ #77: 6 Апрель 2019, 13:29 »

Добрый день!
В Debian Bug Tracking System идёт обсуждение о добавлении
словаря в дистрибутив.
Ознакомиться и принять участие в обсуждении можно по ссылке:
https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=926505
Записан
CryVICSky
Участник
**
Offline Offline

Пол: Мужской
Расположение: Россия, Республика Коми
Сообщений: 19


« Ответ #78: 22 Август 2019, 15:59 »

Yakov, предлагаю немного перестроить работу с наполнением основного словаря для проверки орфографии. Так как новые версии собираются редко, то удобней всего создать на github.com отдельный промежуточный проект с файлом пользовательского словаря совместимого с LO и AOO (C:\Users\...\AppData\Roaming\LibreOffice\4\user\wordbook\standard.dic) и наполнять его новыми словами (скачивать свежий файл standard.dic в любое время и предлагать новые слова для добавления смогут все желающие, причём открыто), а затем после сборки новой версии основного словаря обнулять его и наполнять снова до следующей официальной сборки, проверяя заранее все ошибки. Всем заинтересованным сторонам будет намного удобней.
« Последнее редактирование: 27 Август 2019, 13:14 от CryVICSky » Записан

Windows 10 Pro v.1903.18362.295 (x64) + LibreOffice v.6.2.6.2 (x64, LT v.4.7-2019-08-21-snapshot, Dictionary Pack v.0.4.3) + Java v.8.221 (x64).

Терехов Иван Сергеевич, The CryVICtory Group.
Yakov
Администратор
**
Offline Offline

Сообщений: 2 482


WWW
« Ответ #79: 26 Август 2019, 13:26 »

Да, существующая схема не очень удобна.
В планах доработать форму сбора данных слов для словаря, чтобы упростить работу по обработке полученных слов.
Записан

Envek
Новичок
*
Offline Offline

Сообщений: 2


« Ответ #80: 25 Ноябрь 2019, 16:12 »

Добрый день. Сегодня, когда я экспериментировал с поиском слова «чай» в легендарной фразе «Съешь ещё этих мягких французских булок, да выпей же чаю.» с помощью полнотекстового поиска в PostgreSQL и словаря Hunspell от AOT.ru для нормализации слов, я столкнулся с тем, что в текущем словаре слово «чаю» считается самостоятельным словом, отчего у меня поиск не работает.

Однако же викисловарь считает, что это или форма глагола «чаять» или форма существительного «чай».

Посему я предлагаю из словаря слово «чаю» удалить, а словам «чай» и «чаять» присвоить правильные аффиксы.

Т.е. сейчас, в словаре версии 0.4.3, скачанном с extensions.libreoffice.org, так:
Код:
чай
чаю
чаять

Я предлагаю сделать так:
Код:
чай/126
чаять/527

У себя локально с такими изменениями у меня слово «чаю» начинает определяться как «это или чай или чаять», что на мой взгляд правильно.

Я вообще по адресу пришёл с такими запросами? Смеющийся
Записан
Envek
Новичок
*
Offline Offline

Сообщений: 2


« Ответ #81: 25 Ноябрь 2019, 16:17 »

Ну и присоединюсь к предыдущим ораторам про возможность улучшать словарь через какую-нибудь публичную площадку (например, GitHub.com или GitLab.com). Я бы с удовольствием приходил бы раз в год с небольшими пулл-реквестами с правками типа той, что я выше предложил. Сейчас даже непонятно, куда идти с такими правками/жалобами.
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 482


WWW
« Ответ #82: 25 Ноябрь 2019, 16:54 »

Я вообще по адресу пришёл с такими запросами?
Да, обсудить можно в этой теме.
Предложить новые слова лучше через эту форму
Записан

Yakov
Администратор
**
Offline Offline

Сообщений: 2 482


WWW
« Ответ #83: 25 Ноябрь 2019, 16:57 »

Этот (0.4.3) словарь оптимизирован под работу hunspell, так как при работе с большим числом аффиксов у hunspell начинаются жуткие тормоза и потребление памяти.
Поэтому некоторые редко используемые аффиксы "развёрнуты".
Записан

Yakov
Администратор
**
Offline Offline

Сообщений: 2 482


WWW
« Ответ #84: 25 Ноябрь 2019, 17:07 »

Сейчас я планирую пересобрать словарь с другим набором аффиксов.
Записан

Страниц: « 1 2 3 4 5 6   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!