Ошибка с языком текста

Автор p.cherevin, 27 октября 2016, 11:12

0 Пользователи и 1 гость просматривают эту тему.

p.cherevin

Здравствуйте.

Есть проблема с языком текста после распознавания в FineReader.

Последовательность моих действий.

1. Распознаю русскоязычный документ.
2. Сохраняю в формате ODT.

3. Открываю в LibreOffice. Язык выделения [ru], орфография НЕ проверяется (Screenshot-19.png).
Такого языка ([ru])в LibreOffice не предусмотрено!

4. Меняю в LibreOffice язык выделения на [русский], орфография проверяется (Screenshot-20.png).

Если открывать файл в OpenOffice, проблема отсутствует.

Примеры файлов во вложениях.

kompilainenn

Цитата: p.cherevin от 27 октября 2016, 09:12Такого языка ([ru])в LibreOffice не предусмотрено!

4. Меняю в LibreOffice язык выделения на [русский], орфография проверяется (Screenshot-20.png).
что вас удивляет?
Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут

economist

Виноват FineReader. Он до сих пор не умеет правильно сохранять ODT-файлы.
Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...

p.cherevin

Цитата: economist от 27 октября 2016, 13:39
Виноват FineReader. Он до сих пор не умеет правильно сохранять ODT-файлы.

А почему OpenOffice нормально открывает?

bormant

FineReader пишет в стиль
<style:style ...
<style:text-properties fo:language="ru" fo:country="none"
вместо
<style:style ...
<style:text-properties fo:language="ru" fo:country="RU"
Автору на яд. Поддержать форум.

Yakov

Цитата: p.cherevin от 27 октября 2016, 12:02А почему OpenOffice нормально открывает?
Наверное, у вас OpenOffice.org 3.0 или младше.
Там была специальная галочка "проверять во всех языках".
В более новых версиях это убрали.

p.cherevin

Цитата: bormant от 27 октября 2016, 14:12
FineReader пишет в стиль
<style:style ...
<style:text-properties fo:language="ru" fo:country="none"
вместо
<style:style ...
<style:text-properties fo:language="ru" fo:country="RU"


Всё правильно, если посмотреть спецификацию
Open Document Format for Office Applications (OpenDocument) Version 1.2
Part 1: OpenDocument Schema

    19.236 fo:language
    19.236.1 General
    See §7.9.2 of [XSL]. Compared to the XSL language attribute, the value range of this attribute is
    extended to additional parts of ISO 639.
    This attribute may be ignored if it is not specified together with a fo:country attribute.

Тоесть при отсутствии тега [fo:country], тег с языком может игнорироваться.

Поддержка ABBYY как обычно отфутболивает.
Цитата: ответ поддержки ABBYYНам удалось воспроизвести описанную Вами ситуацию. Мы предполагаем, что она связана с особенностями просмотрщика LibreOffice Writer. Программа ABBYY FineReader 12 Professional поддерживает сохранение в формат ODT OpenOffice.org Writer. Тестирование проводилось для просмотрщика OpenOffice Writer. В данной программе язык документа, созданного в ABBYY FineReader 12 Professional, определяется как "Русский" и описанная Вами ситуация не возникает.

В качестве альтернативного решения Вы можете вручную изменять язык документа на "Русский" в программе LibreOffice Writer, либо использовать для просмотра ODT-документов приложение OpenOffice Writer.

Проблема не стоит выеденного яйца: просто ставим значение [RU] в тег [fo:country] там где язык распознан как русский.