Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

18 Июнь 2021, 15:31 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
Новости: Вы можете задать вопрос по LibreOffice или Apache OpenOffice без регистрации, используя форму
 
   Начало   Помощь Поиск Войти Регистрация    задать вопрос  
Страниц: « 1 2 3 4 5 6 7 8 9 »   Вниз
  Печать  
Автор Тема: Конвертация словаря в формат Hunspell  (Прочитано 97324 раз)
0 Пользователей и 1 Гость смотрят эту тему.
yup
Участник
**
Offline Offline

Сообщений: 12


« Ответ #57929: 23 Март 2021, 19:29 »

Поскольку словарь здешний заявлен как "Орфографический словарь для русского языка (только "Ё")", то решил я посмотреть, насколько корректен он в части "(только "Ё")". Вооружился Hunspell-ом и несколькими самописными программами, обложился академическими словарям, изданными Институтом русского языка, и начал...

Промежуточный итог: около 2000 неправильных слов (т.е., либо слово должно быть в словаре в двух написаниях, а есть только в одном, либо наоборот - должно быть в одном написании, а есть в обоих).

И это окончен лишь первый этап работы, на котором анализировались только слова, непосредственно находящиеся в файле словаря. Сейчас идёт второй этап, на котором анализируются слова, производные от словарных. Судя по накопленной статистике, ошибок найдётся в разы больше, чем на первом этапе  - во многом потому, что правила из файла аффиксов образуют уйму абсурдных конструкций ("сволочлённых", "утончённейшьна" и т.п.)

Файлы со списками слов, найденных на первом этапе, выложить?
Записан
Страниц: « 1 2 3 4 5 6 7 8 9 »   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!