Ошибки LibreOffice-3.5.*

Автор ape, 3 февраля 2012, 02:18

0 Пользователи и 1 гость просматривают эту тему.

Доп. иконки для файлов MS_Office

устраивают
нет
не нужны

ape

#60
Цитата: sorath от 21 марта 2012, 01:08
Wordpad из windows xp...
..безжалостно удаляю (ущербная программулина) при сборке установочного дистрибутива (nLite - в помощь).
Цитата: sorath от 21 марта 2012, 01:19
По поводу проверки качества импорта...
Несколько моментов:
1. Microsoft (по склерозу) сообщала о неполной совместимости DOCX, созданных Word-2007 и Word-2010. Эталоном (по ISO) они считают OXML Word-2010.
2. PDF-файл сильно зависит от программы-создателя: ADOBE, Word-2010, Libre\OpenOffice-3.x.x и т.д. + "производственное задание" программе-создателю, какой (версия) PDF делать. Здесь трудно что-либо сравнивать, т.к. можно поставить недопустимые настройки, применить внестилевое форматирование "печатной машинки", напихать фрагментов DOCX c OLE-объектами и экспорт из LibreOffice будет вообще заканчиваться вылетом программы.

ape

Цитата: ape от 20 марта 2012, 19:43
В 3.5.0\3.5.1 регрессия; устранена сегодня; патч включают в 3.5.2: офис вылетатет при попытке открыть XLS-файл, содержащий диаграммы.
Исправлено в LOdev-3.5.3rc0_Win-x86 (русская локаль от 3.5.1).

[вложение удалено Администратором]

sorath

#62
Цитата: ape от 21 марта 2012, 08:08
1. Microsoft (по склерозу) сообщала о неполной совместимости DOCX, созданных Word-2007 и Word-2010. Эталоном (по ISO) они считают OXML Word-2010.
Подробнее о совместимости пишут здесь
Основная проблема в том, что на момент выхода MS Office 2007 стандарт ISO на формат OOXML ещё не был принят, в связи с дополнительными пожеланиями. На тот момент действовал только стандарт принятый в 2005 году Ecma (не учитывающий исправление замечаний со стороны ISO), в связи с чем то что сохраняет MS Office 2007 и более ранние версии с пакетом совместимости часто вообще не соответствуют стандарту реализованному в MS Office 2010 (И не файт, что соответствует стандарту принятому Ecma).
В связи с этим конечно появляется дополнительные проблемы с совместимостью для разработчиков, которые хотят следовать выполнению стандарта ISO.
Цитата: ape от 21 марта 2012, 08:08
2. PDF-файл сильно зависит от программы-создателя: ADOBE, Word-2010, Libre\OpenOffice-3.x.x и т.д. + "производственное задание" программе-создателю, какой (версия) PDF делать. Здесь трудно что-либо сравнивать, т.к. можно поставить недопустимые настройки, применить внестилевое форматирование "печатной машинки", напихать фрагментов DOCX c OLE-объектами и экспорт из LibreOffice будет вообще заканчиваться вылетом программы.
Подготовленный для сравнения PDF (желательно со встроенными шрифтами) конечно же перед выкладыванием сравнить с его "источником" и желательно указать в какой программе осуществлялся его просмотр (с указанием версии).
В конечном итоге можно попробовать подготовить похожий файл только в MS Office 2010, не сильно забивая его OLE-объектами (и вообще бинарными данными), конечная же цель не "уронить" LibreOffice, а использовать файл для проверки того, что уже отображается, а что нет (хотя насколько помню бывало, когда в определённых случаях OLE отображались только до первого, а потом пропадали - не помню, где видел подобный баг).
Хотя бы можно было бы подготовить похожий на тот файл текст (именно набрать, а не копировать, во избежание дополнительных глюков), даже без OLE-объектов (только с графикой).

Из того же файла в данный момент можно отметить (для версии 3.5.1), что:
1. не обработался принудительный разрыв страницы;
2. Немного странно выглядит график (смещены низ оси или рамка рядом с осями) во вставке фрагмента листа из excel, сами данные в талице редактируемые, диаграмма только отслеживает изменения в таблице, но не редактируется;
3. Не отображаются формулы (у меня видны только пустые квадраты, причём редактируемые)

В целом же в плане совместимости всё выглядит довольно хорошо.

ape

Цитата: sorath от 22 марта 2012, 00:35
Из того же файла в данный момент можно отметить (для версии 3.5.1), что:
...
В целом же в плане совместимости всё выглядит довольно хорошо.
В целом в 3.5.0 и 3.5.1 всё очень плохо. Более-менее хорошо только с 3.5.2rc1 (см. тему "Обходной манёвр").

sorath

Попробовал сегодня "проблемный" файл (proekt_MU.docx) открыть в "msviewer 2003" (бесплатный просмотрщик от Microsoft) c установленным пакетом совместимости, в процессе открытия viewer что-то оооооочень долго делал, почти минуту, так что при создании файла действительно в нём, похоже, сильно накосячили.
Наконец после открытия большая часть формул (видимо созданных ms equation) выглядела нормально, но пара длинных формул (созданных в ms word 2007-2010) отображались как картинки и вываливались за границы листа.
То есть не исключено (помимо предположения, что он был сохранён из какого-то шаблона), что файл могли редактировать в 2-х, а то и 3-х разных версиях word, каждая из которых имеет своё представление о том, что такое .docx.

Так, к примеру, при открытии файла *.docx, созданного в MS Word 2003 c пакетом совместимости, в OOo-3.3.0 не отображаются вставленные картинки и таблицы, в то время как подобный файл созданный в MS Word 2010 не приводит к подобному поведению.
Файлы .docx от 2007 и 2010 версий также отличаются тем, что OOo-3.3.0 видит нумерацию страниц в колонтитулах в первом случае и не видит во втором.
у LibreOffice-3.4.5 (кстати, вышел LO-3.4.6) подобных проблем не наблюдается.

ape

Цитата: sorath от 22 марта 2012, 23:52
1. Попробовал сегодня "проблемный" файл (proekt_MU.docx)... То есть не исключено.. , что файл могли редактировать в 2-х, а то и 3-х разных версиях word...
2. у LibreOffice-3.4.5 (кстати, вышел LO-3.4.6) подобных проблем не наблюдается.
1. Из структуры архива 'proekt_MU' очевидно, что когда-то созданный в МСО-2003 файл 'proekt_MU.doc' был отредактирован в МСО-2010. В том числе, были вставлены новые формулы. Отредактированный файл сохранён МСО-2010 в формате DOCX. Нормально редактировать "ундервудер" не умеет или ленится.
"Удервудер" - опытный, т.е многолетний, использователь текстового прцессора в режиме печатной машинки, от которого проблем с документами больше, чем от всех Офисов.
2. О чём речь? Каких проблем, в какой ОС?

ВсеМыБывшие

Сегодня ради интереса поэксперементировал со счетами Яндекс Директ'а, которые мы получаем в rtf. Оказалось, что LO 3.5.х отображает их корректнее, чем wordpad :) Последний теряет вставленные картинки (логотип Яндекса)
Никогда не спорьте с идиотом. Он опустит вас на свой уровень, а потом задавит опытом.

sorath

#67
Что-то поломали в 3.5.2rc1 (3.5.2.1 Build ID: 1488b14-519dc6f-43021d0-52136ea-8d338cc) c импортом - в 3.4.5 открывалось лучше - намного лучше! Я отписывался в одной из
Даже в 3.5.1 версии, насколько припоминаю, всё так плохо не выглядело.
Проверьте, кто-нибудь ещё, пожалуйста.

Прикрепляю к сообщению архив test_docx.zip со следующими файлами:

1. Исходный test_2010.docx файл, c нуля созданный в MS Office 2010
2. файл test.pdf, созданный при помощи виртуального принтера doPDF, путём сравнения убедился, что внешне он совпадает с исходником - То есть так выглядел документ в Word 2010
3. test_2003.docx - первый файл, открытый в MS Office 2003 SP3 с пакетом совместимости и сохранённый в нём в формате ".docx"
4. test_LO3.5.2.1_2010.pdf - "снимок" созданный из LO c внедрением шрифтов после открытия файла test_2010.docx
5. test_LO3.5.2.1_2003.pdf - "снимок" созданный из LO c внедрением шрифтов после открытия файла test_2003.docx

Напоминаю, что все прилагаемые PDF файлы сравнивались визуально с отображаемым в рекдакторе содержимым


[вложение удалено Администратором]

ape

#68
Цитата: sorath от 23 марта 2012, 23:51
Что-то поломали в 3.5.2rc1 ...
Что поломали-то в импорте DOCX в 3.5.2rc1 относительно 3.4.5 (не вижу)?
-----------
В "fodt" удалил дубль 4-х картинок из верхнего колонтитула.

[вложение удалено Администратором]

sorath

Цитата: ape от 25 марта 2012, 22:22В "fodt" удалил дубль 4-х картинок из верхнего колонтитула.
Значит я чуть не с тем файлом сравнил :\

Это не дубль картинок - это при открытии в LO файла полученного пересохранением в ms word 2003 все 4 картинки (одна и та же в разные места текста была вставлена) все уползают наверх. Если открыть исходный документ, созданный в ms word 2010.

Скриншот получен путём обработки файла  test_2003.docx ? Ведь именно при его открытии картинки уползали, а не в  test_2010.docx :\
И ещё почему-то дублируются формулы оО

ape

#70
При пересохранении  test_2010.docx в test_2010.fodt появлялся дубль картинок. Он, дубль, и удалён. Ваш экспорт в PDF формат терял формулы. О причинах писал в других темах.
О ДОКах. Некоторое форматирование, применяемое в бинарном файле закрытого формата терялось и раньше. Просто при отправке ДОКументов надо знать, какое ПО у адресата, и учитывать это. В Вашем случае дело, скорее всего, в:
- привязке картинок (как символ, к символу..),
- специфике сохранения МСО-2003 {? - 2007},
что и определяет такое поведение LibO.

[вложение удалено Администратором]

sorath

Цитата: ape от 26 марта 2012, 06:17
Ваш экспорт в PDF формат терял формулы.
Импорт в PDF не терял формулы (я сравнивал результат визуально), так как при открытии test_2010.docx в LO-3.5.2rc1 формулы не отображаются, видны только бесцветные рамки полей в которых должны были бы быть формулы. Соотвественно, в PDF невидимые поля тоже не видны, как и в случае ошибки с импортом границ ячеек в таблице, которые не должны быть бесцветными.

По поводу отличия кол-ва папок внутри сохранённого разархивированного .docx - присутствующая в test_2010.docx директория содержит файлы, похоже, относится к хранению файлов описывающих библиографию, так что скорее всего отличия в формате сохраняемого .docx из под word 2003 проявляются в других xml-файлах (формулы в test_2003.docx хранятся в виде *.png, но надо ещё проверить, не сохраняет ли он их помимо этого внутри xml как отдельный объект).

В любом случае, получается, что из под word 2003 лучше в .docx не пересохранять, так как он сам его плохо поддерживает, а пользоваться его родным .doc. Скорее всего так меньше будет сюрпризов при последующем импорте.

ape

#72
Цитата: sorath от 26 марта 2012, 19:50
при открытии test_2010.docx в LO-3.5.2rc1 формулы не отображаются, видны только бесцветные рамки полей в которых должны были бы быть формулы..
См. рисунок
Цитата: ape от 26 марта 2012, 06:17
Ваш экспорт в PDF формат терял формулы.
Ошибся, извините, Ваш файл "прокатывает". Но "proekt_MU.docx" уверенно валит soffice.bin при попытке экспорта в PDF.
---------------------
P.S. Впрочем, "proekt_MU.odt" c 2 типами формул валит процесс аналогичным образом...  :-\
--------------------
LOdev 3.5.3rc0+; ID сборки: af67f5f-a73d29c-6845e52-f269e46-4c023a0 (в новостях) c этой задачей справляется. Будем проверять, вошёл ли баг-фикс в LibO-3.5.2rc2 (должен появиться завтра вечером или послезавтра).

[вложение удалено Администратором]

sorath

Цитата: ape от 26 марта 2012, 23:20
См. рисунок
а у меня не отображаются (прикреплённый файл) :(

Правда запускал просто из распакованного deb-архива (для 3.5.2.1 в Gentoo Linux), может ему ещё каких дополнительных библиотек не хватает :\

Под Windows для LO 3.5.1.2 подтверждаю, что все формулы отображаются и их можно даже подправить, границы ячеек в таблице всё равно бесцветные почему-то :\

[вложение удалено Администратором]

ВсеМыБывшие

 К сожалению ни одна из проверенных мною версий LO 3.5.X не может корректно отобразить rtf счёта ЯндексДирект. Все врут, но по-разному.
Никогда не спорьте с идиотом. Он опустит вас на свой уровень, а потом задавит опытом.