Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

22 Октябрь 2021, 07:32 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
Новости: Здесь можно поблагодарить участников форума Улыбка
 
   Начало   Помощь Поиск Войти Регистрация    задать вопрос  
Страниц: « 1 2 3 4 5 6 7 8 9 »   Вниз
  Печать  
Автор Тема: Конвертация словаря в формат Hunspell  (Прочитано 103555 раз)
0 Пользователей и 1 Гость смотрят эту тему.
cross1983
Гость
« Ответ #75: 30 Март 2019, 13:19 »

Добрый день. Словарь "только ё" допускает написание "девчёнка" и "девчонка".  Слово "девчёнка" - ошибка.
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #76: 1 Апрель 2019, 08:44 »

Согласен.
Записан
pager_sadly
Новичок
*
Offline Offline

Сообщений: 1


« Ответ #77: 6 Апрель 2019, 13:29 »

Добрый день!
В Debian Bug Tracking System идёт обсуждение о добавлении
словаря в дистрибутив.
Ознакомиться и принять участие в обсуждении можно по ссылке:
https://bugs.debian.org/cgi-bin/bugreport.cgi?bug=926505
Записан
CryVICSky
Участник
**
Offline Offline

Пол: Мужской
Расположение: Россия, Республика Коми
Сообщений: 21


« Ответ #78: 22 Август 2019, 15:59 »

Yakov, предлагаю немного перестроить работу с наполнением основного словаря для проверки орфографии. Так как новые версии собираются редко, то удобней всего создать на github.com отдельный промежуточный проект с файлом пользовательского словаря совместимого с LO и AOO (C:\Users\...\AppData\Roaming\LibreOffice\4\user\wordbook\standard.dic) и наполнять его новыми словами (скачивать свежий файл standard.dic в любое время и предлагать новые слова для добавления смогут все желающие, причём открыто), а затем после сборки новой версии основного словаря обнулять его и наполнять снова до следующей официальной сборки, проверяя заранее все ошибки. Всем заинтересованным сторонам будет намного удобней.
« Последнее редактирование: 27 Август 2019, 13:14 от CryVICSky » Записан

Windows 10 Pro v.1909.18363.1379 (x64) + LibreOffice v.7.0.6.2 (x64, LT v.5.5 от 10.07.2021, Dictionary Pack v.0.4.5) + Java v.8.291 (x64).

Терехов Иван Сергеевич, The CryVICtory Group.
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #79: 26 Август 2019, 13:26 »

Да, существующая схема не очень удобна.
В планах доработать форму сбора данных слов для словаря, чтобы упростить работу по обработке полученных слов.
Записан
Envek
Новичок
*
Offline Offline

Сообщений: 2


« Ответ #80: 25 Ноябрь 2019, 16:12 »

Добрый день. Сегодня, когда я экспериментировал с поиском слова «чай» в легендарной фразе «Съешь ещё этих мягких французских булок, да выпей же чаю.» с помощью полнотекстового поиска в PostgreSQL и словаря Hunspell от AOT.ru для нормализации слов, я столкнулся с тем, что в текущем словаре слово «чаю» считается самостоятельным словом, отчего у меня поиск не работает.

Однако же викисловарь считает, что это или форма глагола «чаять» или форма существительного «чай».

Посему я предлагаю из словаря слово «чаю» удалить, а словам «чай» и «чаять» присвоить правильные аффиксы.

Т.е. сейчас, в словаре версии 0.4.3, скачанном с extensions.libreoffice.org, так:
Код:
чай
чаю
чаять

Я предлагаю сделать так:
Код:
чай/126
чаять/527

У себя локально с такими изменениями у меня слово «чаю» начинает определяться как «это или чай или чаять», что на мой взгляд правильно.

Я вообще по адресу пришёл с такими запросами? Смеющийся
Записан
Envek
Новичок
*
Offline Offline

Сообщений: 2


« Ответ #81: 25 Ноябрь 2019, 16:17 »

Ну и присоединюсь к предыдущим ораторам про возможность улучшать словарь через какую-нибудь публичную площадку (например, GitHub.com или GitLab.com). Я бы с удовольствием приходил бы раз в год с небольшими пулл-реквестами с правками типа той, что я выше предложил. Сейчас даже непонятно, куда идти с такими правками/жалобами.
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #82: 25 Ноябрь 2019, 16:54 »

Я вообще по адресу пришёл с такими запросами?
Да, обсудить можно в этой теме.
Предложить новые слова лучше через эту форму
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #83: 25 Ноябрь 2019, 16:57 »

Этот (0.4.3) словарь оптимизирован под работу hunspell, так как при работе с большим числом аффиксов у hunspell начинаются жуткие тормоза и потребление памяти.
Поэтому некоторые редко используемые аффиксы "развёрнуты".
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #84: 25 Ноябрь 2019, 17:07 »

Сейчас я планирую пересобрать словарь с другим набором аффиксов.
Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #85: 29 Май 2020, 16:59 »

Словарь версии 0.4.4
« Последнее редактирование: 5 Июнь 2020, 09:27 от Yakov » Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #86: 29 Май 2020, 17:00 »

Пакет словарей (орфография, тезаурус, переносы) 0.4.4   (19 мая 2020 г.)

Обновление размещаю на форуме, так как на сайте расширений LO происходит обновление дизайна и обновление контента на нём пока затруднено.

Следующую переработанную версию словаря с изменённой структурой аффиксов планирую собрать синхронно с обновлением словарей в LanguageTool. Выпуск версии 5.0 LT запланирован на конец июня 2020г.
« Последнее редактирование: 5 Июнь 2020, 09:27 от Yakov » Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #87: 29 Май 2020, 17:27 »

Тезаурус, использованный в пакете словарей
https://github.com/yakovru/RussianDict/tree/master/Thesaurus
Записан
simurq
Новичок
*
Offline Offline

Сообщений: 3


« Ответ #88: 4 Июнь 2020, 23:05 »

Добрый день!
По-моему, я делаю что-то неправильно. При попытке использовать словари (0.4.4) на Notepad++ в выделяемых словах отсутствует Ё: https://i.imgur.com/QKfMe47.jpg

Знаю, что словари предназначены для LibreOffice (за что огромное спасибо автору!), но так как формат файлов вроде один и тот же, решил перетащить оба (.dic и .aff) в соответствующую папку Hunspell словарей для Notepad++.

PS: Может это от того, что файл .dic закодирован в ANSI? Пробовал заменить на UTF-8, как для стандартного русскоязычного словаря для Notepad++, вообще вариантов замены не предлагает.

Спасибо!
« Последнее редактирование: 4 Июнь 2020, 23:08 от simurq » Записан
Yakov
Администратор
**
Offline Offline

Сообщений: 2 588


WWW
« Ответ #89: 5 Июнь 2020, 00:16 »

У словаря есть и другая редакция, где буква ё приравнена к е,
https://extensions.openoffice.org/en/project/russkiy-orfograficheskiy-slovar-aot-eyo-russian-spellcheck-dict-ieyo-based-works-aotru
Записан
Страниц: « 1 2 3 4 5 6 7 8 9 »   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!