Тезаурус, орфографический словарь и лингвистические инструменты.

Автор Yakov, 16 мая 2012, 00:10

0 Пользователи и 1 гость просматривают эту тему.

Yakov

В ходе экспериментов с тезаурусом OOo заметил, что если он установлен без орфографического словаря,
то тезаурус понимает только слова в базовой форме.
Если установлен орфографический словарь - то во всех  формах, которые заданы в орф. словаре.
Но результат он выдаёт только в базовой форме!
Есть идея интегрировать тезаурус, например, в LanguageTool.
Это позволит находить повторяющиеся слова в тексте, и предлагать для них варианты исправления из тезауруса с учётом формы слова.
Есть ли потребность в таком инструменте?

VlhOwn

Лично у меня - нет, вряд ли бы пользовался, даже если бы он был. Юзвери, возможно, пользовались бы, если бы подсказка замены слова возникала автоматически при наборе повторяющегося.

bormant

Потребность есть. Если правильно понимаю, инструмент должен отслеживать ляпы наподобие нижеприведённого? Или приставки/суффиксы делают слово уникальным?

Пользователи, возможно, пользовались бы, для сокращения использования повторов однокоренных слов.
Автору на яд. Поддержать форум.

Yakov

Ок.
Цитата: bormant от 17 мая 2012, 09:54Если правильно понимаю, инструмент должен отслеживать ляпы наподобие нижеприведённого?
Да.

Yakov

На данный момент сделал правило, которое выявляет повторяющиеся слова в рамках предложения. При этом эти слова могут быть в разных грамматических формах.
(разные падежи, времена, и т.д.) Поиск осуществляется на основе встроенного словаря. При анализе исключаются местоимения и некоторые предлоги из списка анализируемых слов.
http://www.languagetool.org/download/snapshots/LanguageTool-20120601-snapshot.oxt
Ещё отключил правило, которое определяло просто повторяющиеся слова, так как эти правила во многом друг друга дублируют.