Расстановка переносов, подскажите как усm

Автор Kreol2013, 7 декабря 2013, 21:42

0 Пользователи и 1 гость просматривают эту тему.

Kreol2013

Господа, доброе время суток.
кросс http://www.cyberforum.ru/openoffice/thread1032456.html#post5453359
пытаюсь 2 дня понять каким же образом всунуть словарь для расстановки переносов и успешно его применить.
Пытался внедрять как питон приложение отсюда.
https://gitorious.org/hyphenator/hyphenator/source/2cbe4d52327b54358d30867663ae3c0985b9cdce:hyphenation/rules
Ничего не получается.
В ссылке выше есть файлы с dic
Буду очень признателен за консультацию, каким же образом всунуть и использовать эти словари.
win7x64 openoffice4
Пытался неоднократно найти в сети как это делается, все сводится к тому, что создать dict\ooo\ засунуть словарь, что дальше ? непонятно.
Странно, неужели нельзя создать нормальную утилиту для таких вещей?
Стоит на виртуалке Linux, пытался там что-то сделать там. Но там совсем все глухо. Объяснения почти такиеже и толку нет.
Если кто расскажет как в винде и пингвине это сделать, буду очень признателен

[вложение удалено Администратором]

Yakov

#1
Цитата: Kreol2013 от  7 декабря 2013, 20:42Буду очень признателен за консультацию, каким же образом всунуть и использовать эти словари.
win7x64 openoffice4
Пытался неоднократно найти в сети как это делается, все сводится к тому, что создать dict\ooo\ засунуть словарь, что дальше ? непонятно.
dict\ooo  - это применимо к ветке 2.x OpenOffice.org
Начиная с 3 версии словари упаковываются в расширения.
Обычно в расширение включают сразу словарь переносов, тезаурус и орфографический словарь.
Но их можно сделать отдельно.

В репозитарии расширений OpenOffice
уже есть много словарей.
На нашей вики есть статья о том,как создать орфографический словарь
http://wiki.forumooo.ru/wiki/Hunspell_Dict

Для словаря переносов необходимо добавлять соответствующее описание в dictionaries.xcu
например в вашем случае

<node oor:name="HyphDic_hi-IN" oor:op="fuse">
 <prop oor:name="Locations" oor:type="oor:string-list">
  <value>%origin%/hyph_hi-IN.dic</value>
 </prop>
 <prop oor:name="Format" oor:type="xs:string">
  <value>DICT_HYPH</value>
 </prop>
 <prop oor:name="Locales" oor:type="oor:string-list">
  <value>hi-IN</value>
 </prop>
 </node>

Yakov

dictionaries.xcu

<?xml version="1.0" encoding="UTF-8"?>
<oor:component-data xmlns:oor="http://openoffice.org/2001/registry" xmlns:xs="http://www.w3.org/2001/XMLSchema" oor:name="Linguistic" oor:package="org.openoffice.Office">
<node oor:name="ServiceManager">
   <node oor:name="Dictionaries">
       <node oor:name="HyphDic_hi-IN" oor:op="fuse">
  <prop oor:name="Locations" oor:type="oor:string-list">
   <value>%origin%/hyph_hi-IN.dic</value>
  </prop>
  <prop oor:name="Format" oor:type="xs:string">
   <value>DICT_HYPH</value>
  </prop>
  <prop oor:name="Locales" oor:type="oor:string-list">
   <value>hi-IN</value>
  </prop>
  </node>
   </node>
</node> 
</oor:component-data>


Yakov


Kreol2013

Благодарю.
Готовое решение установил. Интересует следующее.
В управлении расширениями оно есть.
Для создания расстановки мне необходимо зайти в меню Сервис -> Язык -> Расстановка переносов?
Если да, то как я узнаю что именно хинди словарь будет работать?
Просто если в документе ничего нету, то нажав на расстановку переносов, получаем месагу, что расстановка закончена и все. Это так и должно работать?
У меня есть большой список слов, мне его нужно поделить переносами "-".

[вложение удалено Администратором]

Kreol2013

Продолжая разборки... делюсь опытом.
Так как я так и не понял как же заставить расставлять переносы даже с готовым решением, ударился во все тяжкие.
Сперва сварганим файл .oxt
открываем его архиватором, заменяем словарь с правилами расстановки. Изменяем остальные файлы как описано в http://wiki.forumooo.ru/wiki/Hunspell_Dict далее открыв в архиваторе файл oxt просто копируем новые файлы. Закрываем и вуаля, словарик готов.
Правой кнопкой "Установить" и вот он в OOO
Но при этом в вики написано, что УСТАНОВЛЕННЫЙ словарь должен быть с галочкой

У нас же ее нету, возможно она появляется только тогда, когда это полноценный словарь?
Мыслим дальше.
Для большей вероятности, что работаем именно с нашим словарем, я удалил у себя все остальные модули.

Ну и по всей видимости единственное решение для проверки, это вставка текста на деванагари и Сервис -> Язык -> Расстановка переносов.
В итоге никакой расстановки не происходит,  возникает вопрос, когда же она работает?
Прикладываю файл с текстом на деванагари и перенос для него (sa) И в iast тоже самое. Я правда не знаю, как они правильно должены работать.
Буду признателен за дальнейшие разъяснения

[вложение удалено Администратором]

Yakov

#6
Необходимо задействовать расширенную поддержку языков (смотри скриншот)

В разделе "Расширенная языковая поддержка" поставить галочку Элементы интерфейса для двунаправленной письменности.
В этом случае становится активным в разделе "Языки документов по умолчанию" пункт "Со сложными системами письменности"
И там можно выбрать Стандарт - Хинди или Хинди.

Кроме того, в Настройках языка появляется дополнительный пункт "Сложные системы письменности"
Цитата: Kreol2013 от  8 декабря 2013, 03:54
Но при этом в вики написано, что УСТАНОВЛЕННЫЙ словарь должен быть с галочкой

Буду признателен за дальнейшие разъяснения
Это относится к западным языкам.
И самое главное, для проверяемого текста должен быть корректно задан язык.

Язык отображается в строке состояния для того текста, на котором стоит курсор.

[вложение удалено Администратором]

Yakov

Включить расстановку переносов можно через стили (см. рисунок)
Рекомендуется использовать свой стиль, а не изменять стиль с названием "Базовый"

[вложение удалено Администратором]

Kreol2013

Как же все сложно. Сделал все как Вы написали.
Возник вопрос, если мы собираемся обрабатывать хинди, то понятно, что шрифт должен быть хинди. Но если это деванагари или траслит (iast) какой шрифт должен быть? Возможно есть мысли.
К сожалению пока что я так и не увидел, чтобы в тексте при всем вышеописанном хоть что-то изменилось.
Возможно где-то есть видео как это работает для других языков? Завтра продолжу истязания над данным вопросом.
Спасибо.
Если же попробовать применить расстановку через меню, то при удаленных всех словарях, получаю скрин.

[вложение удалено Администратором]

Yakov

Цитата: Kreol2013 от  9 декабря 2013, 02:50Но если это деванагари или траслит (iast) какой шрифт должен быть? Возможно есть мысли.
Посмотрите это расширение:
http://extensions.services.openoffice.org/en/project/rupantar
И эти расширения:
http://extensions.services.openoffice.org/en/search?query=Hindi&sort_by=field_project_stats_year&sort_order=DESC

gasyoun

Спасибо, что откликнулись.

Как тогда http://thottingal.in/blog/2008/12/13/hyphenation-of-indian-languages-and-openoffice/ ? Это устарело настолько, что не применимо вовсе? Советы хорошие, но под Убунту и с Виндой не имеют ничего общего?

Цитата: Yakov от 11 декабря 2013, 21:05http://extensions.services.openoffice.org/en/project/rupantar

Это для написания в деванагари. Писать нет необходимости. Все уже написано. Вопрос как к написанному применить переносы.

По второй ссылке подходит http://extensions.services.openoffice.org/en/project/hindi-spellchecker-dictionary и по аналогии http://www.youtube.com/watch?v=Br6V5doY4uI OpenOffice greek spell check and dictionary installation можно понять, как поставить.

Но это все равно не показывает логику работы переносов. Ничего почти не настраивомо.