Файл открыть

Автор МР, 7 апреля 2014, 10:26

0 Пользователи и 1 гость просматривают эту тему.

МР

Сайт одной из госструктур формирует при "экспорте в Excel" файл, подобный прикрепленному. Несмотря на расширение, подразумевается, видимо, xml2003 или что-то подобное. MS Excel файл действительно открывает без проблем, проблемы начинаются при отсутствии Excel. Libre Office и Оpen Оffice пытаются открыть его как файл с разделителями. Вьювер XLVIEW.EXE (это уже так, попутно) вообще не может файл открыть. Не можете ли подсказать сравнительно несложный выход из ситуации - приведения файла к какому-то узнаваемому формату? Может его как обычный текстовый файл как-то подработать можно? Добавить/удалить/заменить строки в шапке или ещё где?

[вложение удалено Администратором]

Hasim

Без Экселя с госструктурами вообще нечего делать - все госструктуры заточены под Эксель или Ворд.

frob

XML-CRITICAL **: Opening and ending tag mismatch: ss:Data line 654 and Data

Поправьте закрывающий тэг в 654-ой строке.

МР


Цитата: frob от  7 апреля 2014, 09:53XML-CRITICAL **: Opening and ending tag mismatch: ss:Data line 654 and DataПоправьте закрывающий тэг в 654-ой строке.

Пока не помогло. А не подскажете ли, чем файл анализировался? Я, к сожалению, в XML полный 0      

ape

Ваш файл не признаётся правильным и МСО-2007, т.е. содержит нарушение XLS формата.
Исправления (МСО-2007, включая конвертацию в ODS) во вложении. "lo-fix.ods" - результат преобразования XLSX в ODS с помощью LibO.

[вложение удалено Администратором]

Hasim

Идеальный после исправления и проверки в XML Copy Editor.

Заменить расширение на .xml (.xml форум не пропускает?!)

[вложение удалено Администратором]

МР

Вопрос состоит в том, как преобразовать получаемые файлы в доступный LO/ОО формат без MS Office. Простая замена расширения не помогает. Было предположение, что желаемого можно достичь  простыми средствами работы с текстовыми файлами.

Hasim

Цитата: МР от  7 апреля 2014, 11:51
Вопрос состоит в том, как преобразовать получаемые файлы в доступный LO/ОО формат без MS Office. Простая замена расширения не помогает. Было предположение, что желаемого можно достичь  простыми средствами работы с текстовыми файлами.
Ответ: LibreOffice/OpenOffice не могут открыть файл такого формата.
И переделывать "идеальный" XML под то, что они могут открыть - это кошмарная работа.

Yakov

Цитата: Hasim от  7 апреля 2014, 11:36
(.xml форум не пропускает?!)
Добавлено в список допустимых расширений.

ape

#9
Цитата: МР от  7 апреля 2014, 10:51Вопрос состоит в том, как преобразовать получаемые файлы в доступный LO/ОО формат без MS Office.
Ваш файл, с вероятностью 95%, создавался в МСО-2003 из XLSX МСО-2007 (указана 14-я версия МСО). Этот, XLSX, формат 13-м Офисом поддерживается только на чтение. Вероятно поэтому при сохранении файла, он получил такое расширение. Обратите внимание, что XLS - бинарный формат, а Ваш файл - это XML c неправильным расширением. Для специфичного XML-2003 формата вы вряд найдётся какая-либо программа, отличная от МСО или Microsoft XML Editor, которая исполнит ваши желания.

МР

#10
Цитата: ape от  7 апреля 2014, 19:42
Цитата: МР от  7 апреля 2014, 10:51Вопрос состоит в том, как преобразовать получаемые файлы в доступный LO/ОО формат без MS Office.
Ваш файл, с вероятностью 95%, создавался в МСО-2003 из XLSX МСО-2007 (указана 14-я версия МСО). Этот, XLSX, формат 13-м Офисом поддерживается только на чтение. Вероятно поэтому при сохранении файла, он получил такое расширение. Обратите внимание, что XLS - бинарный формат, а Ваш файл - это XML c неправильным расширением. Для специфичного XML-2003 формата вы вряд найдётся какая-либо программа, отличная от МСО или Microsoft XML Editor, которая исполнит ваши желания.

Подозреваю, что файл создавался вообще не офисом. Я его открываю в МСО-2003 с установленным пакетом совместимости. Здесь он открывается, в LO/ОО - нет. При сохранении МСО-2003  предлагает его сохранить как XML таблицу (именно так), после чего он открывается и в LO, и в ОО. Просматривал в блокноте файл до и после сохранения. Отличаются конечно. Могу предположить, что на сайте где он взят после "'экспорта в Excel", создается как обычный текстовый файл с неполным соответствием формату. Проверили - открывается в Excel - и ладно. Но что-то совсем уж специфическое получилось - не открывается ни в многочисленными вьюверами Excel, ни в Google Docs, ни даже в One Drive через WebApps. Ну что ж, будет у заинтересованного лица повод МСО у работодателя выпросить вместо LO. Там ситуация такая - на сайте гос. организации пользователь заполняет определенную форму, затем через экспорт в excel  получает файл к себе на компьютер. Предполагается что файл будет распечатан, подписан и т.д. Пока без похода с флешкой к счастливым обладателям МСО не получается

frob

Цитата: МР от  7 апреля 2014, 19:27Подозреваю, что файл создавался вообще не офисом.

146 пудов...

Файл наверняка создавался какой-то самонаколеночной фигнёй, которая генерит что сумеет  и как попало.
При попытке открыть то что было в запущенном из консоли gnumeric, в консоль вываливается сообщение о проблемах с тэгами.
Файл надо открыть в любом текстовом редакторе показывающем номера строк, перейти к нужной строке и исправить тэги.
Я ещё удалил пустую строку в начале файла.

Если предполагать, что чудилы выпускающие такие файлы стабильны в своих ошибках, то можно наваять несложный скрипт, который такие ошибки будет исправлять.

2 Hasim: LO/AOO открывают файл "такого" формата. Для этого достаточно исправить лажу в тэгах.

Засада с открытостью MOOX в том, что любой дурак может наколхозить НЕЧТО сохраняющее что-то похожее на МООХ и как-то похоже на задуманное открывающееся в каких-то версиях MSO. В силу доминирующего положения МСО, всем остальным придётся или быть багосовместимыми, или бороться с ветряными мельницами объясняя юзерам, что файлы сгенерированные через анус представляют из себя фекалии: "Ну МС офис же их открывает! Значит файлы хорошие, а ваша программа -- [censored]".

ape

#12
Цитата: frob от  8 апреля 2014, 05:03146 пудов...Файл наверняка создавался какой-то самонаколеночной фигнёй, которая генерит что сумеет  и как попало.
100% - XML не использует СР-1251 (см. разницу свойств исходного и правильного XML)
Цитировать
<?xml version="1.0" encoding="windows-1251"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:x="urn:schemas-microsoft-com:office:excel"
xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:html="http://www.w3.org/TR/REC-html40">
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">
 <Author>АИК «Миграционные квоты»</Author>
 <LastAuthor>AndrewTs</LastAuthor>
 <Created>2014-04-04T13:18:00Z</Created>
 <Version>14</Version>
</DocumentProperties>
Цитировать<?xml version="1.0"?>
<?mso-application progid="Excel.Sheet"?>
<Workbook xmlns="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:o="urn:schemas-microsoft-com:office:office"
xmlns:x="urn:schemas-microsoft-com:office:excel"
xmlns:ss="urn:schemas-microsoft-com:office:spreadsheet"
xmlns:html="http://www.w3.org/TR/REC-html40">
<DocumentProperties xmlns="urn:schemas-microsoft-com:office:office">
 <Author>АИК «Миграционные квоты»</Author>
 <LastAuthor>_</LastAuthor>
 <Created>2014-04-04T13:18:00Z</Created>
 <Version>12.00</Version>
</DocumentProperties>

МР


Цитата: frob от  8 апреля 2014, 05:03146 пудов...Файл наверняка создавался какой-то самонаколеночной фигнёй, которая генерит что сумеет  и как попало.При попытке открыть то что было в запущенном из консоли gnumeric, в консоль вываливается сообщение о проблемах с тэгами.Файл надо открыть в любом текстовом редакторе показывающем номера строк, перейти к нужной строке и исправить тэги.Я ещё удалил пустую строку в начале файла.Если предполагать, что чудилы выпускающие такие файлы стабильны в своих ошибках, то можно наваять несложный скрипт, который такие ошибки будет исправлять.2 Hasim: LO/AOO открывают файл "такого" формата. Для этого достаточно исправить лажу в тэгах.Засада с открытостью MOOX в том, что любой дурак может наколхозить НЕЧТО сохраняющее что-то похожее на МООХ и как-то похоже на задуманное открывающееся в каких-то версиях MSO. В силу доминирующего положения МСО, всем остальным придётся или быть багосовместимыми, или бороться с ветряными мельницами объясняя юзерам, что файлы сгенерированные через анус представляют из себя фекалии: "Ну МС офис же их открывает! Значит файлы хорошие, а ваша программа -- [censored]".

Собственно, примерно то же самое я с самого начала и писал, только менее эмоционально. Но, к сожалению, пока не получилось после ручного исправления  получить читаемый хоть в чем-то, кроме Excel файл. Скрипт на каком-нибудь vbs я бы и сам наваял. "Было бы что ваять"

frob

#14
В текстовом редакторе из исходного файла удалены четыре символа.

Результат: