Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

23 Апрель 2021, 00:06 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
Новости: Часто задаваемые вопросы по LibreOffice и Apache OpenOffice.org
 
   Начало   Помощь Поиск Войти Регистрация    задать вопрос  
Страниц: 1 2 »   Вниз
  Печать  
Автор Тема: Выравнивание последней строки на странице  (Прочитано 1186 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Adriano
Участник
**
Offline Offline

Сообщений: 9


« Стартовое сообщение: 8 Март 2021, 19:28 »

Приветствую форумчан!
Хочу максимально приблизить OCR к оригиналу. Возникла проблема с последней строкой на странице, которая упорно не выравнивается по правому краю, как в оригинале. Что можете подсказать?



« Последнее редактирование: 8 Март 2021, 19:57 от Adriano » Записан
economist
Форумчанин
***
Offline Offline

Сообщений: 1 424


« Ответ #1: 9 Март 2021, 00:18 »

Shift + Enter в нужном месте справа.

На рисунке в топике - как раз все получилось как надо. Но сама задача кажется очень странной. После OCR - в 100 страничной книге будет ~10 ошибок, которые фиг найдешь, кроме как внимательно прочесть 5-6 раз. Вот на что нужно тратить силы.

Если нужно обеспечить идентичность строк - в OCR-проге настройками вставляют переносы строки вместо абзацев, и потом ручками правят сами абзацы. Еще можно подобрать шрифт максимально точно метрически, для этого есть онлайн-сервисы (ссылки не знаю).   
Записан

Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...
Adriano
Участник
**
Offline Offline

Сообщений: 9


« Ответ #2: 9 Март 2021, 15:37 »

Благодарю. Попробую с этим вариантом. Мысль была — вставить разрывы страниц и затем на каждой странице только то, что относится к этой странице. К сожалению, не получается так из-за отступа на последней строке справа.
Все для того, чтобы получить в электронном текстовом виде (в пдф) идентичный печатному текст. Причем полностью идентичный сделать сложно, из-за большого количества ручной работы по расстановке переносов как в оригинале. Так что хотелось бы просто сохранять абзацы на своих страницах.
В книге бывают комментарии с номерами на каждой странице. Нужно их сохранять на своих страницах. Также при цитировании бумажной книги, приводится номер страницы, и в электронной версии нужно сохранить номера страниц и соответствующий текст, как в оригинале.
Записан
kompilainenn
Мастер
*****
Offline Offline

Сообщений: 3 250



« Ответ #3: 9 Март 2021, 16:55 »

А что вы вообще делаете?
Записан

Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут
Adriano
Участник
**
Offline Offline

Сообщений: 9


« Ответ #4: 9 Март 2021, 18:57 »

Переношу некоторые книги по истории науки в электронный формат.
Записан
Adriano
Участник
**
Offline Offline

Сообщений: 9


« Ответ #5: 9 Март 2021, 19:03 »

Вот что получилось:


Почти похоже и шрифт подошел, только маленькое несоответствие есть.
Пришлось обойтись без разрывов, как страницы так и строки. Разрыв страницы нарушает выравнивание абзаца справа, а разрыв строки, напротив, сдвигает символы направо.
Записан
kompilainenn
Мастер
*****
Offline Offline

Сообщений: 3 250



« Ответ #6: 9 Март 2021, 22:03 »

Переношу некоторые книги по истории науки в электронный формат.
И какова цель сохранения исходного форматирования один в один?
А вы знаете, что читать с экрана шрифт с засечками труднее, чем шрифт без засечек?
А размер шрифта в 12 кегль, который еще читаем с бумаги, с экрана не очень-то виден.
Вы подумайте над форматированием электронного документа.
Ибо сомневаюсь я, что книги кто-то из ПДФ будет печатать. Будут их читать (если будут вообще) с экрана.
Записан

Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут
Adriano
Участник
**
Offline Offline

Сообщений: 9


« Ответ #7: 10 Март 2021, 19:58 »

И какова цель сохранения исходного форматирования один в один?
Целей две: 1. Цитировать с сохранением нумерации страниц. 2. Сохранение комментариев на «своих» страницах.

А вы знаете, что читать с экрана шрифт с засечками труднее, чем шрифт без засечек?
Спорно. По мне так  все очень хорошо читается.

При обработке сканов книг столкнулся с тем, что приходится заново расставлять иллюстрации, плюс убегают комментарии. Все это в итоге не очень красиво выходит. Так что пробую первый экземпляр. Но вижу много ручной работы.
Записан
kompilainenn
Мастер
*****
Offline Offline

Сообщений: 3 250



« Ответ #8: 10 Март 2021, 20:20 »

Но вижу много ручной работы.
Стили спасут вас

2. Сохранение комментариев на «своих» страницах.
о каких комментариях речь?
Записан

Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут
kompilainenn
Мастер
*****
Offline Offline

Сообщений: 3 250



« Ответ #9: 10 Март 2021, 22:02 »

Спорно
https://habr.com/ru/company/tinkoff/blog/498878/ ну не знаю
Записан

Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут
Adriano
Участник
**
Offline Offline

Сообщений: 9


« Ответ #10: 12 Март 2021, 18:53 »

о каких комментариях речь?
Об этих

Здесь номера комментариев на каждой странице идут по новой. Если делать не один к одному то комментарии «убегают» относительно номера страницы. И обратите внимание на первую сноску в которой ссылка на другую сноску на определенной странице. Эта ссылка потеряет смысл в электронной версии при не соблюдении формата «один к одному».
« Последнее редактирование: 12 Март 2021, 18:59 от Adriano » Записан
kompilainenn
Мастер
*****
Offline Offline

Сообщений: 3 250



« Ответ #11: 12 Март 2021, 20:09 »

Эта ссылка потеряет смысл в электронной версии при не соблюдении формата «один к одному».
не потеряет. Вы все равно в тексте вставляете сноску, а в теле сноски делаете поле со ссылкой на страницу, где расположена другая сноска (см.вложение)

* Сноски с полями.odt (9.51 Кб - загружено 3 раз.)
Записан

Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут
kompilainenn
Мастер
*****
Offline Offline

Сообщений: 3 250



« Ответ #12: 12 Март 2021, 21:14 »

Тут мне идея пришла в голову, а зачем распознавать текст вообще?! Отсканируйте и оставьте, как PDF. Все будет аутентично оригиналу
Записан

Поддержать разработчиков LibreOffice можно тут, а наш форум вот тут
economist
Форумчанин
***
Offline Offline

Сообщений: 1 424


« Ответ #13: 12 Март 2021, 23:39 »

Распознать невидимым слоем для поиска по словам может бесплатный и брошенный PDFXChange-Viewer

https://www.tracker-software.com/product/pdf-xchange-viewer/download?fileid=446

PDF останется внешне тем же, появится лишь возможность Ctrl+F

Если он не понравится (всему заводу - нравится) - есть пяток навсегда бесплатных скриптов на Python, которые можно запустить прямо из LO. Они распознают текст с NLP и нейросетями - очень "чотко", и уложат его невидимым слоем поверх PDF.
Записан

Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...
Adriano
Участник
**
Offline Offline

Сообщений: 9


« Ответ #14: 13 Март 2021, 15:03 »

не потеряет. Вы все равно в тексте вставляете сноску, а в теле сноски делаете поле со ссылкой на страницу, где расположена другая сноска (см.вложение)
Да, неплохо.
Записан
Страниц: 1 2 »   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!