Yakov
|
2 Яков: а нельзя ли сделать фичу, чтобы при выборе пункта "Добавить в словарь" для некоторого слова, оно бы при (наличии инета), передавалось на сервер, где можно было бы его добавить в официальную сборку?
Эта возможность, скорей всего, более уместна для интерактивной формы проверки http://myooo.ru/component/option,com_spellingandgrammarcheckform/Itemid,133/Но из-за особенностей реализации проверки орфографии, словарь в LT и словарь для LO/OOo ( http://extensions.openoffice.org/en/project/russian-dictionary-pack-only-yo-aot-paket-slovarey-dlya-russkogo-yazyka-na-osnove-proekta) всё-таки различаются.
|
|
« Последнее редактирование: 27 Январь 2015, 10:27 от Yakov »
|
Записан
|
|
|
|
CryVICSky
Участник

Offline
Пол: 
Расположение: Россия, Республика Коми
Сообщений: 21
|
Yakov, я тоже один из тех, кто поддерживает эту фичу обеими руками и ногами.  Хотелось бы иметь возможность прямо из независимой оболочки выделять и отправлять новые слова на сервер, но и для интерактивной формы проверки она критически нужна. Можно даже для начала открыть на форуме специальную тему, где от пользователей начать собирать новые слова для словарей. Кстати, на просторах интернета существует ресурс с достаточно удобной и интересной функциональностью для активно развивающихся проектов - reformal.ru - сервис для обратной связи с пользователями. Его применение было бы очень кстати в данной ситуации, да и не только в ней.
|
|
« Последнее редактирование: 17 Февраль 2015, 21:10 от CryVICSky »
|
Записан
|
Windows 10 Pro v.1909.18363.1379 (x64) + LibreOffice v.7.0.6.2 (x64, LT v.5.5 от 10.07.2021, Dictionary Pack v.0.4.5) + Java v.8.291 (x64).Терехов Иван Сергеевич, The CryVICtory Group.
|
|
|
CryVICSky
Участник

Offline
Пол: 
Расположение: Россия, Республика Коми
Сообщений: 21
|
Yakov, хотелось бы ещё попросить о функции автоматического сохранения, в независимой сборке утилиты, последних размеров основного окна и нижнего рабочего (где отображаются результаты проверки текста), с которыми была закрыта программа.
К предыдущему своему сообщению добавлю один момент... В независимой сборке утилиты представляю реализацию дополнительного пользовательского словаря, в который можно было бы добавлять, отсутствующие в основном, слова, а в дальнейшем иметь возможность группой их отправлять на сервер в любой или определённый момент времени. Данная функциональность достаточно тонкая особенность любых текстовых редакторов и к ней стоит относиться с глубоким трепетом и осторожностью, чтобы не было ничего лишнего.
|
|
« Последнее редактирование: 21 Февраль 2015, 21:44 от CryVICSky »
|
Записан
|
Windows 10 Pro v.1909.18363.1379 (x64) + LibreOffice v.7.0.6.2 (x64, LT v.5.5 от 10.07.2021, Dictionary Pack v.0.4.5) + Java v.8.291 (x64).Терехов Иван Сергеевич, The CryVICtory Group.
|
|
|
Yakov
|
В независимой сборке утилиты представляю реализацию дополнительного пользовательского словаря В ежедневных сборках доступна такая функциональность. Единственное, добавлять в этот словарь можно только с помощью внешнего текстового редактора. Список слов для спеллчекера хранится в файлах spelling.txt в подкаталогах resource/xx/hunspell. Для словаря частей речи это будет файл added.txt в подкаталогах resource/xx/, где xx- код языка.
|
|
|
Записан
|
|
|
|
CryVICSky
Участник

Offline
Пол: 
Расположение: Россия, Республика Коми
Сообщений: 21
|
В ежедневных сборках доступна такая функциональность. Единственное, добавлять в этот словарь можно только с помощью внешнего текстового редактора. Хотелось бы видеть данную функциональность в виде пункта контекстного меню по нажатию ПКМ (--> Добавить в словарь). А алгоритм уже бы сам добавлял слова куда нужно. То есть реализация данной функциональности должна быть частью интерфейса программы. Хотелось бы иметь возможность также по нажатию ПКМ в контекстном меню найти пункт - «Просмотреть словарь», после нажатия на который открывалось бы небольшое окошко со списком уже добавленных слов и дополнительными кнопками: «Удалить» и «Добавить». Самая простая и, в тоже время, максимально удобная и понятная реализация. Список слов для спеллчекера хранится в файлах spelling.txt в подкаталогах resource/xx/hunspell. Для словаря частей речи это будет файл added.txt в подкаталогах resource/xx/, где xx- код языка. В данном случае возникает сразу куча вопросов... В какой форме вносить слова? Есть ли разница между этими словарями? Куда эти словари затем отправлять?
|
|
« Последнее редактирование: 22 Февраль 2015, 10:07 от CryVICSky »
|
Записан
|
Windows 10 Pro v.1909.18363.1379 (x64) + LibreOffice v.7.0.6.2 (x64, LT v.5.5 от 10.07.2021, Dictionary Pack v.0.4.5) + Java v.8.291 (x64).Терехов Иван Сергеевич, The CryVICtory Group.
|
|
|
Yakov
|
Есть ли разница между этими словарями? Да. spelling.txt - это проверка орфографии. added.txt используется только для проверки грамматики. Причём для этого словаря вносится не только само слово, но и его базовая форма, а так же код части речи (postag). И для этого словаря для каждого слова необходимо обязательно вносить все словоформы, иначе проверка грамматики не будет правильно работать. Кроме того, в программе есть бинарный словарь обратного преобразования частей речи, которому нет дополнения в виде текстового файла. То есть при массовом добавлении слов необходимо всё равно пересоздавать бинарный словарь (даже 3 словаря: словарь частей речи, обратный словарь частей речи, словарь для проверки орфографии).
|
|
|
Записан
|
|
|
|
Yakov
|
Куда эти словари затем отправлять? мне на е-mail.
|
|
|
Записан
|
|
|
|
|
CryVICSky
Участник

Offline
Пол: 
Расположение: Россия, Республика Коми
Сообщений: 21
|
Yakov, в текущей разрабатываемой версии пользовательские словари (spelling.txt, added.txt) в той или иной степени уже заполнены словами. Как с ними быть? Добавлять новые слова прямо к ним или оформлять свой пользовательский словать отдельно, чтобы затем отправить тебе на почту?
Дополнение:
Также я понял, что реализация заполнения словаря для проверки грамматики (added.txt) ещё достаточно трудна для обычного пользователя. Этот процесс так или иначе требуется автоматизировать и упростить для восприятия. В связи с этим обстоятельством, сейчас меня больше будет интересовать заполнение словаря для проверки орфографии (spelling.txt) и отправки его тебе на почту. Кстати, не могу найти почтовый адрес. Хотя мне проще отправить его (ссылку на текстовый файл словаря в Яндекс.Диске) личным сообщением.
|
|
« Последнее редактирование: 24 Февраль 2015, 15:35 от CryVICSky »
|
Записан
|
Windows 10 Pro v.1909.18363.1379 (x64) + LibreOffice v.7.0.6.2 (x64, LT v.5.5 от 10.07.2021, Dictionary Pack v.0.4.5) + Java v.8.291 (x64).Терехов Иван Сергеевич, The CryVICtory Group.
|
|
|
Yakov
|
Лучше прислать только новые слова.
|
|
|
Записан
|
|
|
|
Yakov
|
а нельзя ли сделать фичу, чтобы при выборе пункта "Добавить в словарь" для некоторого слова, оно бы при (наличии инета), передавалось на сервер, где можно было бы его добавить в официальную сборку? Реализовано для формы проверки текста на http://languagetool.org/ru/Спасибо Helen за реализацию формы добавления слов в словарь!
|
|
« Последнее редактирование: 28 Март 2015, 16:18 от Yakov »
|
Записан
|
|
|
|
CryVICSky
Участник

Offline
Пол: 
Расположение: Россия, Республика Коми
Сообщений: 21
|
Yakov, разъясни, пожалуйста, в чём разница обычных сборок LT от сборок LT-wikipedia? И ещё вопрос в догонку: в параметрах LT появилась настройка каталога для ngram. Что это за каталог такой и что такое ngram-а(-ы)? Я так понял, что эта функциональность ещё не реализована для русского модуля, но мне пока вообще её суть непонятна.
|
|
|
Записан
|
Windows 10 Pro v.1909.18363.1379 (x64) + LibreOffice v.7.0.6.2 (x64, LT v.5.5 от 10.07.2021, Dictionary Pack v.0.4.5) + Java v.8.291 (x64).Терехов Иван Сергеевич, The CryVICtory Group.
|
|
|
Yakov
|
в чём разница обычных сборок LT от сборок LT-wikipedia? LT-wikipedia предназначена для сайта community.languagetool.org С её помощью выполняется тестирование правил для languagetool на основе данных с сайта wikipedia.org На настоящий момент проверка "последних правок" с wikipedia.org отключена из-за большой загрузки сайта. Но для английского языка она активна.
|
|
« Последнее редактирование: 24 Октябрь 2015, 23:39 от Yakov »
|
Записан
|
|
|
|
Yakov
|
Что это за каталог такой и что такое ngram-а(-ы)? Я так понял, что эта функциональность ещё не реализована для русского модуля, но мне пока вообще её суть непонятна. Работа с ngram на данный момент реализована только для английского языка. Для использования этой функциональности необходим очень большой набор данных ngram (так называемый Big data), который надо скачивать отдельно. Объём этих данных в упакованном виде - 8 Гб. Эти данные включают в себя статистическую информацию о частотности употребления фраз. + Необходимо создание специальных правил. В версии 3.1 LT возможность использования ngram была активирована сразу для нескольких языков, для которых есть данные ngram https://books.google.com/ngrams/
|
|
|
Записан
|
|
|
|
CryVICSky
Участник

Offline
Пол: 
Расположение: Россия, Республика Коми
Сообщений: 21
|
Эти данные включают в себя статистическую информацию о частотности употребления фраз. + Необходимо создание специальных правил. В версии 3.1 LT возможность использования ngram была активирована сразу для нескольких языков, для которых есть данные ngram Yakov, благодарю за столь подробное разъяснение. Только из него вытек ещё один уточняющий вопрос: для каких целей нужна эта статистическая информация о частотности употребления фраз в LT?
|
|
|
Записан
|
Windows 10 Pro v.1909.18363.1379 (x64) + LibreOffice v.7.0.6.2 (x64, LT v.5.5 от 10.07.2021, Dictionary Pack v.0.4.5) + Java v.8.291 (x64).Терехов Иван Сергеевич, The CryVICtory Group.
|
|
|
|