Проблема с rtf файлом

Автор coloradobug, 2 февраля 2017, 11:51

0 Пользователи и 1 гость просматривают эту тему.

coloradobug

В приложении файл, сгенерированный программой КонсультантПлюс (это местная база данных правовой информации). Когда я этот файл открываю в LibreOffice Writer, то сам процесс открытия занимает полчаса(!). Но это еще полбеды. Половина таблиц внутри документа поплыли, т.е. отображены не корректно. Попробовал в МС Ворде - 10 секунд открытие, отображает все нормально. Нужна помощь, что не так? Проблема в документе или в программе?

economist

Проблема в формате RTF аж 1983 года выпуска и в реализации экспорта в RTF внутри программы К+.
Также есть проблема в неукротимом желании изменять текст Приказа Минздрава РБ, вместо его чтения и копирования из него текста в другую программу, что можно сделать и без экспорта куда-либо.

Если нужно "ехать, а не шашечки" - то в K+ посылаете на печать на виртуальный бесплатный PDF-принтер и получаете нормальный и компактный PDF-файл с живыми гиперссылками и опрятным видом, хорошо читаемый на любых устройствах и программах.   
Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...

mikekaganski

@economist: Ваш подход понятен, и если единственная цель спрашивающего - смочь прочитать документ - Вы решили его проблему. Если бы здесь был исключительно хэлпдеск - всё было бы правильно.

Но ведь здесь также невредно и просто обсуждать проблемы с ЛО, не правда ли? Ведь проблема есть, и дело не в годе выпуска спецификации формата (кстати, она не оставалась на месте с момента первой публикации). Ведь не факт, что кто-то не получит такое же в виде документа, который ему всё же нужно будет редактировать, несмотря на неукротимое нежелание.
С уважением,
Михаил Каганский

economist

mikekaganski - Проблема с гигантскими RTF, криво "срендеренными" в прикладных программах, - есть не только в OpenOffice|LibreOffice, но и в MSO. Сам формат ущербен и исторически выжил только благодаря открытости спецификации, что тогда было в диковинку. Нужно всячески его избегать в жизни, и PDF - хороший выход. Лично получил обещание от ЗАО "Консультант-плюс" переделать рендер "во что-то другое" в 2017 году. ODF там тоже рассматривается. Существуют гигантские проблемы с RTF при работе с таблицами, по масштабности сравнимые в офисах - со стихийными бедствиями.

Кстати, классический хелпдеск на такие вопросы как в (0) отвечает так:

"У ваш RTF-файл открылся за 3 минуты, так что делайте апгрейд".

Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...

coloradobug

Цитата: economist от  2 февраля 2017, 13:02
Проблема в формате RTF аж 1983 года выпуска и в реализации экспорта в RTF внутри программы К+.
Также есть проблема в неукротимом желании изменять текст Приказа Минздрава РБ, вместо его чтения и копирования из него текста в другую программу, что можно сделать и без экспорта куда-либо.

Если нужно "ехать, а не шашечки" - то в K+ посылаете на печать на виртуальный бесплатный PDF-принтер и получаете нормальный и компактный PDF-файл с живыми гиперссылками и опрятным видом, хорошо читаемый на любых устройствах и программах.  
Проблема в том, что у меня часто бухгалтерия и юристы работают с документами из этой программы. А у меня на носу лицензирование, и я хотел перевести офисных на LibreOffice Writer. Если у меня люди не смогут работать, то им плевать какого года формат rtf-файла, "если в ворде все работает..."
Вот вам простой пример, мне нужно часть таблиц из этого приказа собрать и выделить в отдельный документ для глав. врача. Вы мне предлагаете все сохранить в pdf, потом распознавать и править в таблицах?

mikekaganski

ОП: напишите багрепорт. Вот Вам тестовый файл, без лишнего.
С уважением,
Михаил Каганский

economist

coloradobug - я с вашей техоперацией сталкиваюсь 10 раз в день, в К+ жму Ctrl+W и... текст автоматически передается в формате RTF в OpenOffice|LibreOffice Writer. Причем в 99,999% без проблем. Даже Налоговый кодекс РФ на 600 страниц. Тут просто ЕДИНИЧНАЯ проблема, связанная с самим документом и движком К+. Таких пользователей у меня - с десяток. За 10 лет мы видели подобный глюк однажды, это был большой справочник кодов ОКОНХ/ОКВЭД/ОКП.  

Кстати, PDF распознавать не надо, текст просто из него копируется, точно так же как из Word. И да, надо быть большим оптимистом, чтобы из здоровенного RTF-документа (прямо в нём самом) делать маленький, а не копировать частями в отформатированный маленький ODT. Как только вы и ваши пользователи это поймут - производительность такого труда вырастет вдвое. Сам из семьи врачей, про писанину знаю не по наслышке :-)
Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...

ape

#7
Цитата: mikekaganski от  2 февраля 2017, 15:14
ОП: напишите багрепорт. Вот Вам тестовый файл, без лишнего.
Специально проверял на слабеньком нетбуке...

RTF-файл ТС
ASUS EeePC-1015PN: Atom N570(1,66 MHz) + ION
---
Версия: 5.2.5.1
ID сборки: 0312e1a284a7d50ca85a365c316c7abbf20a4d22
Потоков ЦП: 4; Версия ОС: Windows 5.1; Отрисовка ИП: по умолчанию;
Локаль: ru-RU (ru_RU); Calc: group
Время открывания загрузки файла - 3 часа 15 минут
---
Версия: 3.6.7.2
ID сборки: e183d5b
Время открывания загрузки файла - 27 минут

Явная регрессия.
Иных LibreOffice на нетбуке нет, поэтому определить последнюю работающую версию программы не могу.
---
p.s. Хочу обратить внимание, что "Консультант-Плюс" всегда отдаёт интересующий закон в RTF-формате, упакованным в ZIP-архив.

rvi

"p.s. Хочу обратить внимание, что "Консультант-Плюс" всегда отдаёт интересующий закон в RTF-формате, упакованным в ZIP-архив."

Если использовать кнопку "Ещё", то можно скачивать документы и в других форматах

ape

#9
Результаты работы достаточно мощного компьютера с RTF-файлом топик-стартёра:

ПК: Xeon-1230_v2 (3,3 MHz); Windows XP 64-bit Edition
---
МСО-2007 показывает, что исходный RTF файл имеет 543 страницы.
---
Версия: 5.2.5.1
ID сборки: 0312e1a284a7d50ca85a365c316c7abbf20a4d22
Потоков ЦП: 8; Версия ОС: Windows 5.2; Отрисовка ИП: по умолчанию;
Локаль: ru-RU (ru_RU); Calc: group
Время загрузки файла - 35,5 минут; открывается 1218 страниц; при сохранении в формате ODT и перезагрузке сохранённого файла число страниц не изменяется; увеличение числа страниц происходит из-за слёта (объединения столбцов таблицы) столбцов; столбцы построчно объединяются в один, а объединяемая ячейка становится перенесённой строкой в ячейке 1-го столбца своей строки.
---
Версия 3.6.7.2
ID сборки: e183d5b
Время загрузки файла - 03 минуты 03 секунды; открывается 940 страниц; при сохранении в формате ODT и перезагрузке файла оказывается, что страниц 615; листинг до конца текста спустя некоторое время устанавливает, что страниц всего 430; документ открыт полностью, без потери строк таблицы.

файлы прилагаю. Можно убедиться, что регрессия есть не только во времени загрузки RTF файла, но и в работе с таблицами
---
p.s. К сожалению, личные обстоятельства выбивают меня на пару недель из обсуждения темы и лишают возможности поработать с Багзиллой по этим двум ошибкам...

coloradobug

Я написал багрепорт, жду.

mikekaganski

Цитата: coloradobug от  8 февраля 2017, 09:26
Я написал багрепорт

Дайте ссылку, пожалуйста.

Цитата: coloradobug от  8 февраля 2017, 09:26
, жду.

Не стоит рассчитывать на мгновенную реакцию. Конечно, баг попытаются как можно скорее протестировать и подтвердить, но вот потом сколько понадобится на исправление (пока разработчик озадачится) - неизвестно.
С уважением,
Михаил Каганский

coloradobug

Цитата: mikekaganski от  8 февраля 2017, 08:03Не стоит рассчитывать на мгновенную реакцию. Конечно, баг попытаются как можно скорее протестировать и подтвердить, но вот потом сколько понадобится на исправление (пока разработчик озадачится) - неизвестно.
Да я и не спешу, прекрасно понимаю. Решаем проблему другим способом.
Дал в пример ваш файл.
https://bugs.documentfoundation.org/show_bug.cgi?id=105700

mikekaganski

Ох.
Конечно, нужна там дополнительная информация. Чтобы кто-нибудь понял. Разработчики в основном англоязычные.
Я сделал новый: https://bugs.documentfoundation.org/show_bug.cgi?id=105852
С уважением,
Михаил Каганский

coloradobug