Каких слов не хватает в орфографическом словаре?

Автор Рыбка Рио, 15 июня 2010, 10:57

0 Пользователи и 1 гость просматривают эту тему.

Yakov

Собрана доработанная версия словаря Роганова-Книжника с буквами е и ё!


[вложение удалено Администратором]

Андрей2014

#76
Я смотрю всю тему идет обсуждение скорости работы, но никто не поднимает вопрос о качестве самого словаря. Я вот открыл сейчас файл словаря dict_ru_RU-rk-ieyo-0.4.2

...
чьянибудь
...
чыда
чэффин
...
яяяя
...

первое слово пишется через дефис, а второе и третье (если это иностранные имена собственные) должны вписываться в основные правила русского языка - после "ч" буква "ы" не пишется, так же как и "э" (вместо них - "и" и "е" соответственно). Последнее вообще непонятно что.
И это только то, что на вскидку бросилось в глаза. Боюсь представить, сколько подобных ошибок там ещё содержится...

Yakov

#77
Цитата: Андрей2014 от  5 декабря 2014, 13:31никто не поднимает вопрос о качестве самого словаря
Обратите внимание, что этот словарь гораздо старше, чем словарь Лебедева.
Качество словаря объясняется особенностью того метода, которым был составлен словарь: на основе обработки большого количества книг, возможно часть из них была обработана с помощью OCR.
При подготовке версии  0.4.2 много слов типа  "яяяя" было вычищено из словаря, по сравнению с оригинальным авторским словарём.


Yakov

Подробнее о методе составления словаря можно прочитать в файле Readme.russian (в кодировке koi8-R)

Yakov

#79
Наиболее качественным словарём для hunspell на данный момент является словарь на базе АОТ
http://forumooo.ru/index.php/topic,106.msg28683.html#new

Андрей2014

Цитата: Yakov от  5 декабря 2014, 20:05При подготовке версии  0.4.2 много слов типа  "яяяя" было вычищено из словаря, по сравнению с оригинальным авторским словарём.
Ну где же вычищено, если я вижу это "яяяя" именно в 0.4.2 (пост 14027)?

Yakov

#81
В оригинальном словаре таких вхождений было гораздо больше, поэтому и написано типа "яяяя", а не  "яяяя".
Задача была только конвертировать словарь из формата Ispell в hunspell и упаковать в расширение для OpenOffice.org, но не изменять словарь.
Вывод команды diff  (отличие между  основным файлом словаря 0.4.1 и 0.4.2)

diff russian-rk.dic russian-rk-ieyo.dic  > difference.txt


1c1
< 322147
---
> 322130
5d4
< юбалхо
9d7
< юбилаумшахт
485,499d482
< аааааа
< ааааааа
< аааааааа
< ааааааааа
< аааааааааа
< ааааааааааааа
< ааааааааааааааааа
< ааааааааааааааааааа
< аааааааххххх
< аааааййааар
< ааааа/E
< аааа/E
< ааадыыыын
< ааа/E
< ааб


Задачей выпуска версии 0.4.2 было включение возможности использования буквы Ё, а не правка самого словаря.