Language Tool - проверка грамматики для русского языка

Автор ForumOOo (бот), 12 мая 2008, 23:00

0 Пользователи и 1 гость просматривают эту тему.

Yakov

#75
Цитата: Yakov от  7 января 2014, 22:52После тестирования буду пересобирать словарь и для LT. http://forumooo.ru/index.php/topic,106.msg23675.html#msg23675
Сделал!
Обновлённый словарь  частей речи вошел в сборку LT от 10 марта (на основе ревизии AOT r242)
https://languagetool.org/download/snapshots/LanguageTool-20140310-snapshot.oxt  расширение LO\OOo
https://languagetool.org/download/snapshots/LanguageTool-20140310-snapshot.zip независимая версия

Орфографический словарь для независимой версии не менялся.

При создании словаря исправлены ошибки (вместо тега NN:Neut слова были помечены тегом NNN:Neut), которые были выявлены при создании новых правил.

Кроме того, в программу добавлено много новых правил.
Добавлены новые правила по поиску "ложных друзей переводчика" (false frends) для текстов на английском и русском языке.
Переработаны старые правила для улучшения качества проверки.

Yakov

В сборке от 12 марта 2014 https://www.languagetool.org/download/snapshots/LanguageTool-20140312-snapshot.zip
в словарь для проверки орфографии внесена дополнительная информация (частотность употребления слов), которая используется при формировании вариантов исправлений орфографических ошибок.

Этот словарь доступен только для независимой версии.

Yakov

В сборке от 30 августа 2014
https://languagetool.org/download/snapshots/LanguageTool-20140830-snapshot.oxt
в словарь слов, написанных через дефис,  добавлено много новых слов, взятых из основного словаря программы.
Выполнена работа по поиску возможных коллизий (на основе данных системы автоматического тестирования сборок LT).
Добавлено несколько новых правил, и несколько существующих улучшены.

Ivan

Зачем введено правило, заменяющее две идущие друг за другом открывающие или закрывающие кавычки на одну?
Насколько мне известно, юридическую силу имеют «Правила русской орфографии и пунктуации» (М., 1956), в которых поглощение кавычек запрещено.
Ссылка: http://www.gramota.ru/spravka/rules/?rub=oszp
§ 200, примечание 2:
«Если в начале или в конце цитаты (то же относится к прямой речи) встречаются внутренние и внешние кавычки, то они должны различаться между собой рисунком (так называемые «елочки» и ,,лапочки"), причем внешние кавычки не должны опускаться...»

Кстати, предложение «Нечто другое не могло бы его испугать.» правильно с грамматической точки зрения и эквивалентно предложению «Что-то другое не могло бы его испугать.»

Yakov

Цитата: Ivan от  7 октября 2014, 14:11Зачем введено правило, заменяющее две идущие друг за другом открывающие или закрывающие кавычки на одну?

http://sourceforge.net/p/languagetool/feature-requests/38/   

Yakov

Цитата: Ivan от  7 октября 2014, 14:11Ссылка: http://www.gramota.ru/spravka/rules/?rub=oszp
§ 200, примечание 2:
«Если в начале или в конце цитаты (то же относится к прямой речи) встречаются внутренние и внешние кавычки, то они должны различаться между собой рисунком (так называемые «елочки» и ,,лапочки"), причем внешние кавычки не должны опускаться...»
Вот именно! Речь идёт о кавычках разного рисунка, а правило обрабатывает один рисунок для кавычек.

Ivan

Я думаю, что действующими правилами поглощение кавычек запрещено. Там сказано: «Если в начале или в конце цитаты (то же относится к прямой речи) встречаются внутренние и внешние кавычки, то они должны различаться между собой рисунком...» В начале предложения речь идёт о логических кавычках (о том, что содержащийся внутри одного текста в кавычках (Т1) другой текст (Т2), также заключённый в кавычки, находится сразу после открывающей кавычки Т1 или непосредственно перед закрывающейся кавычкой Т1). Далее говорится, что в такой ситуации обязательно применять кавычки разного вида: «...они должны различаться между собой рисунком...». Посмотрите, там нет ни одного примера поглощения кавычек, есть только примеры с изменением рисунка.
Поглощение кавычек опасно для пишущего, потому что в некоторых случаях оно является ещё одним источником многозначности текста: один и тот же текст с поглощением кавычек эквивалентен более чем одному тексту без поглощения. Сравните:
1) «Т» = «Т» или «,,Т"» и так далее;
2) «Т1 «Т2» Т3» = «Т1 «Т2» Т3» или «,,Т1 «Т2»" Т3» или «Т1 ,,«Т2» Т3"» и так далее.

Yakov

#82
В правилах типографики как раз и говорится о том, что надо использовать РАЗНЫЕ кавычки, но:
Цитировать
Если по техн. причинам невозможен набор кавычек другого рисунка, кавычки одного рисунка рядом не повторяются.

http://tran.su/o-kavyichkah/

Цитировать
Допустимо: «Цыганы» мои не продаются вовсе», — сетовал Пушкин.

Ivan

С моей точки зрения, справочник Мильчина не имеет юридической силы. Действуют именно «Правила русской орфографии и пунктуации» (М., 1956), и в этих правилах поглощение идущих подряд одинаковых кавычек запрещено, как и повторение одинаковых. Если бы это правило относилось только к разным кавычкам, было бы бессмысленно говорить, что «они должны различаться между собой рисунком». Из двух способов решения этой проблемы в указанных мною правилах есть только один: применять кавычки, отличающиеся рисунком.
Справочник Мильчина имеет большой объём по сравнению с действующими правилами (поиск этой книги даёт мне количества страниц: 687, 800, 1084) и является по сути альтернативными правилами. Размер действующих правил не превышает 180 страниц. Смотрите http://www.rv.ru/content.php3?id=1099.
Автор статьи указывает, что справочники такого объёма не могут быть лишь дополнениями к действующим правилам; оттуда же я взял максимальное количество страниц действующих правил.
Я не имею ничего против повторения одинаковых кавычек (они не вносят в текст многозначности из-за существования открывающих и закрывающих кавычек), но текст с поглощением кавычек я считаю неправильным (такому тексту соответствует бесконечное количество интерпретаций).
Ваша программа применяет кодировку UTF-8 для файлов описания правил, а кавычки двух рисунков есть даже в кодировке CP-1251. По-моему, пользователь всегда может применить кавычки разных рисунков. Поскольку есть кавычки двух видов, всегда можно однозначно найти соответствующую закрывающую кавычку программными средствами, но в этом нет необходимости: замену рисунка кавычек можно не предлагать, это сделает сам пользователь.

Yakov


DixiX57

Словосочетание "на встречу" LanguageTool 2.8 подчёркивает синим. Понятно, что в случае "Я иду навстречу движению" пишется слитно, но ведь в случае "Я иду на встречу с искусством" - пишется раздельно.

kompilainenn

Цитата: DixiX57 от 15 января 2015, 19:26Словосочетание "на встречу" LanguageTool 2.8 подчёркивает синим.
синий - это ошибка грамматики, орфография красной волной метится...нет?
Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут

kompilainenn

2 Яков: а нельзя ли сделать фичу, чтобы при выборе пункта "Добавить в словарь" для некоторого слова, оно бы при (наличии инета), передавалось на сервер, где можно было бы его добавить в официальную сборку?
Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут

Yakov

Цитата: DixiX57 от 15 января 2015, 19:26Словосочетание "на встречу" LanguageTool 2.8 подчёркивает синим. Понятно, что в случае "Я иду навстречу движению" пишется слитно, но ведь в случае "Я иду на встречу с искусством" - пишется раздельно.
Правило исправлено. Изменения будут доступны в ночной сборке.

Yakov

Цитата: kompilainenn от 15 января 2015, 20:10синий - это ошибка грамматики, орфография красной волной метится
Да.