LanguageTool API

Автор mikekaganski, 21 марта 2023, 10:44

0 Пользователи и 1 гость просматривают эту тему.

mikekaganski

Конечно, эту тему надо вести на https://forum.languagetool.org/, но здесь можно спросить по-русски, так что прошу прощения за офтопик.

В LanguageTool API есть возможность задать язык (и несколько вариантов одного языка с приоритетом) для всего проверяемого фрагмента; можно указать, какие части фрагмента не должны проверяться (являются разметкой). Но я не нашёл, как указать, что конкретные части фрагмента имеют заданный язык (то есть у всего фрагмента один язык, а у некоторых слов - другие). Чтобы не полагаться на некие эвристики, а передать информацию, уже имеющуюся в LibreOffice.

Есть ли подобный механизм? Я бы полагал, что это должно было реализовываться так же, как и механизм пометки частей как разметки; но ни в документации, ни в исходном коде я не нашёл чего-то похожего. Чего-нибудь типа

{"annotation":[
 {"text": "A "},
 {"markup": "<b>"},
 {"text": "test", "language": "en-US"},
 {"markup": "</b>"}
]}

Или, возможно, есть рекомендация, как это обработать и передать правильно имеющимися средствами?
С уважением,
Михаил Каганский

Yakov

Цитата: mikekaganski от 21 марта 2023, 10:44Есть ли подобный механизм?
В настоящий момент нет, но попытки реализовать были: First step towards multi-lingual LT