Тезаурус, орфографический словарь и лингвистические инструменты.

Yakov · 16 мая 2012, 00:10

В ходе экспериментов с тезаурусом OOo заметил, что если он установлен без орфографического словаря,
то тезаурус понимает только слова в базовой форме.
Если установлен орфографический словарь - то во всех формах, которые заданы в орф. словаре.
Но результат он выдаёт только в базовой форме!
Есть идея интегрировать тезаурус, например, в LanguageTool.
Это позволит находить повторяющиеся слова в тексте, и предлагать для них варианты исправления из тезауруса с учётом формы слова.
Есть ли потребность в таком инструменте?

VlhOwn · 17 мая 2012, 08:50

Лично у меня - нет, вряд ли бы пользовался, даже если бы он был. Юзвери, возможно, пользовались бы, если бы подсказка замены слова возникала автоматически при наборе повторяющегося.

bormant · 17 мая 2012, 10:54

Потребность есть. Если правильно понимаю, инструмент должен отслеживать ляпы наподобие нижеприведённого? Или приставки/суффиксы делают слово уникальным?

Пользователи, возможно, пользовались бы, для сокращения использования повторов однокоренных слов.

Yakov · 17 мая 2012, 22:34

Ок.

Цитата: bormant от 17 мая 2012, 09:54Если правильно понимаю, инструмент должен отслеживать ляпы наподобие нижеприведённого?

Да.

Yakov · 2 июня 2012, 19:45

На данный момент сделал правило, которое выявляет повторяющиеся слова в рамках предложения. При этом эти слова могут быть в разных грамматических формах.
(разные падежи, времена, и т.д.) Поиск осуществляется на основе встроенного словаря. При анализе исключаются местоимения и некоторые предлоги из списка анализируемых слов.
http://www.languagetool.org/download/snapshots/LanguageTool-20120601-snapshot.oxt
Ещё отключил правило, которое определяло просто повторяющиеся слова, так как эти правила во многом друг друга дублируют.

Форум поддержки пользователей LibreOffice, Apache OpenOffice

Новости:

Тезаурус, орфографический словарь и лингвистические инструменты.

Yakov

VlhOwn

bormant

Yakov

Yakov