Лавинообразное увеличение файла HTML.

Автор 13hex, 5 апреля 2022, 04:54

0 Пользователи и 1 гость просматривают эту тему.

13hex

Здравствуйте! Создан документ HTML, состоящий как обычно из ссылки и папки. Документ - 2 стр. текста и несколько картинок, самая большая из которых 57КБ. Заметил, что размер ссылки стал неадекватно увеличиваться при простейшем редактировании. Допустим, при последнем сохранении документа размер файла .html был 630 КБ. На следующий день открываю файл .html для редактирования (в самом LibreOffice, разумеется), и размер файла был тот же. Далее небольшое редактирование текста - вставлено 3 слова и несколько пробелов - закрываю с сохранением. Размер файла .html увеличился до 1,3МБ! Стало интересно! Вновь открываю, ввожу 3 слова уже просто ради интереса, закрываю - размер файла .html уже 5,93МБ!
Снова повторяю то же самое - размер .html 12,7МБ!!! В-общем, после 4-х подобных редактирований с участием 3-х слов, LibreOffice намертво завис. После восстановления документа и повторного сохранения, размер файла .html составил 582МБ.
Дальше экспериментировать не стал, думаю, файл .html займёт таким образом весь жёсткий диск. Но, получается, что документ безвозвратно испорчен.

Просьба подсказать, пожалуйста, что происходит или что я делаю не так. Спасибо! 

Version: 7.3.2.2 (x86) / LibreOffice Community
OS: Windows 7 Service Pack 1

kompilainenn

Изначальный файл можно выложить?
Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут

13hex

Спасибо за ответ! Я бы с удовольствием, но он весит сейчас полгигабайта, а исходной копии его я не сохранил. Но так ведёт себя любой html- файл, созданный в LibreOffice на моей машине. Возможно, дело в ней - пока нет возможности проверить на другой. Пробовал даже отключать интернет, думал, вдруг какая-то подгрузка идёт оттуда - не помогло, да и скорость трафика в таком случае была бы слишком высока.
Перед версией программы 7.3, была установлена 6-я (точный индекс не помню) - было то же самое. Поэтому и решил искать помощь.

Могу создать новый файл, сохранить его копию, проделать с ним то же самое, и отправить Вам исходный. Но только вечером.

sokol92

Владимир.

13hex

Создал новый файл HTML с другим содержанием и картинками. После некоторого цикла copy - paste текста и изображений (раз 10 примерно, или чуть больше), редактирования текста, смена шрифта, удаления лишнего текста и изображений и т.п. - и дальнейших выходов из программы с сохранением после каждого редактирования, файл .html стал резко раздуваться. После того, как его размер превысил 1МБ, после каждого сохранения размер увеличивался в 2 раза. Под конец я просто удалял текст и изображения, тем не менее файл .html пух, и на данный момент достиг размера 157МБ. При исходных 14,3КБ.

Пока, наконец, не удалил вообще всё содержание, и тогда его размер стал равным 709 байт.

bigor

Не могу повторить. Сделал несколько циклов открыл Ctrl+A, Ctrl+C, Ctrl+End, Ctrl+V, Ctrl+S, закрыл LO, иногда еще менял формат шрифта, удалял втавлял фотки. В итоге размер файла стал больше 2 Мб и больше 1000 листов. Удалил все лишнее, оставил первоначальные листы и размер стал 14 Кб
Version: 7.3.1.3 / LibreOffice Community
Build ID: 30(Build:3)
CPU threads: 4; OS: Linux 5.10; UI render: default; VCL: kf5 (cairo+xcb)
Поддержать разработчиков LibreOffice можно можно тут, а наш форум вот тут

mikekaganski

Вижу проблему.
Открываю в Version: 7.3.2.2 (x64) / LibreOffice Community
Build ID: 49f2b1bff42cfccbd8f788c8dc32c1c309559be0
CPU threads: 12; OS: Windows 10.0 Build 19044; UI render: default; VCL: win
Locale: ru-RU (ru_RU); UI: en-US
Calc:

Добавляю один пробел после "or metabolic problems.". Сохраняю. Закрываю. Открываю. Удаляю этот пробел. Закрываю.

После каждого сохранения размер увеличивается в экспоненциальной прогрессии.
С уважением,
Михаил Каганский

mikekaganski

#7
... и проблема - в русских именах изображений. Они кодируются некорректно, и при каждом сохранении их длина удваивается.

Вероятно, проблема специфична для Windows (или, скорее, для систем, где системная кодировка - не UTF-8, что редкость для не-Windows систем).
tdf#148413.
С уважением,
Михаил Каганский

mikekaganski

Для обхода проблемы установите кодировку для сохранения HTML вручную на UTF-8.
С уважением,
Михаил Каганский

sokol92

Владимир.

13hex

Цитата: mikekaganski от  6 апреля 2022, 10:52Для обхода проблемы установите кодировку для сохранения HTML вручную на UTF-8

Действительно, кодировка была Кириллица (Windows-1251). Поменяю и буду пробовать.
Большое спасибо Вам за помощь!!!

13hex

Всё отлично!
Кодировку в LO изменил на Юникод (UTF-8). Попробовал в одном из файлов .html с увеличенным объёмом более 4МБ, созданном в кодировке Кириллица, удалить и по новой вставить все изображения, и сохранить уже в новой кодировке - файл резко "похудел" до 29КБ.

Ещё раз ув.Михаилу и всем большое спасибо!)