Многозначность русских слов и произношение

Автор AllPo, 6 октября 2015, 18:46

0 Пользователи и 1 гость просматривают эту тему.

AllPo

Необходимо заменить -- в проверке грамматики и орфографии русского языка, многозначные термины и слова без специального ударения, на -- два слова с правильными ударениями над буквами.

Needs to be replaced - in checking the spelling and grammar of the Russian language, multi-valued terms and words without special emphasis on - two words with the correct accents of letters.

Обязательные ударения в неоднозначностях (некоторые слова):

архивоведение = архивове́дение — архивоведе́ние
атлас = а́тлас — атла́с
атласный = а́тласный — атла́сный
бакан = ба́кан — бака́н
басма = ба́сма — басма́
белки = бе́лки — белки́
берег = бе́рег — берёг
берегу = бе́регу — берегу́
большая = бо́льшая — больша́я
боры = бо́ры — боры́
бочка = бо́чка — бочка́
броня = бро́ня — броня́
будите = бу́дите — буди́те
бури = бу́ри — бури́
валите = ва́лите — вали́те
в душе = в ду́ше — в душе́
ведение = ве́дение — веде́ние
вёдро = вёдро — ведро́
венец = ве́нец — вене́ц
верхом = ве́рхом — верхо́м
вести = ве́сти — вести́
взвихрить = взви́хрить — взвихри́ть
взвихриться = взви́хриться — взвихри́ться
вина = ви́на — вина́
виски = ви́ски — виски́
воды = во́ды — воды́
возите = во́зите — вози́те
волос = во́лос — воло́с
вольно = во́льно — вольно́
ворон = во́рон — воро́н
ворона = во́рона — воро́на
воронить = воро́нить — ворони́ть
ворот = во́рот — воро́т
ворота = во́рота — воро́та
восхитить = восхи́тить — восхити́ть
восхититься = восхи́титься — восхити́ться
врезать = вре́зать — вреза́ть
врезаться = вре́заться — вреза́ться
временной = временно́й — вре́менной
временная = временна́я — вре́менная
всыпать = всы́пать — всыпа́ть
всыпаться = всы́паться — всыра́ться
в связи = в свя́зи — в связи́
выводить = вы́водить — выводи́ть
выводиться = вы́водиться — выводи́ться
вывозить = вы́возить — вывози́ть
вывозиться = вы́возиться — вывози́ться
выкликать = вы́кликать — выклика́ть
выкупать = вы́купать — выкупа́ть
выкупаться = вы́купаться — выкупа́ться
вылазить = вы́лазить — выла́зить
вымерять = вы́мерять — вымеря́ть
выносить = вы́носить — выноси́ть
выноситься = вы́носиться — выноси́ться
вырезать = вы́резать — выреза́ть
вырезаться = вы́резаться — выреза́ться
высыпать = вы́сыпать — высыпа́ть
высыпаться = вы́сыпаться — высыпа́ться
выходить = вы́ходить — выходи́ть
вычитать = вы́читать — вычита́ть
гаванский = га́ванский — гава́нский
гвоздик = гво́здик — гвозди́к
глотка = гло́тка — глотка́
глоток = гло́ток — глото́к
года = го́да — года́
горе = го́ре — горе́
горы = го́ры — горы́
Господа = Го́спода — господа́
готов = го́тов — гото́в
графа = гра́фа — графа́
грозы = гро́зы — грозы́
гроши = гро́ши — гроши́
дома = до́ма — дома́
дорезать = доре́зать — дореза́ть
дорезаться = доре́заться — дореза́ться
дорог = до́рог — доро́г
досыпать = досы́пать — досыпа́ть
досыпаться = досы́паться — досыпа́ться
дохнуть = до́хнуть — дохну́ть
духи = ду́хи — духи́
душа = ду́ша — душа́
души = ду́ши — души́
дыбы = ды́бы — дыбы́
еду = е́ду — еду́
еры = е́ры — еры́
жаркое = жа́ркое — жарко́е
жёны = жёны — жены́
жила = жи́ла — жила́
жучка = жу́чка — жучка́
забегать = забе́гать — забега́ть
забухать = забу́хать — забуха́ть
заводи = за́води — заводи́
заворот = за́ворот — заворо́т
зазубрить = зазу́брить — зазубри́ть
зазубриться = зазу́бриться — зазубри́ться
залом = за́лом — зало́м
замковый = за́мковый — замко́вый
замок = за́мок — замо́к
запах = за́пах — запа́х
запахнуть = запа́хнуть — запахну́ть
зарезать = заре́зать — зареза́ть
засели = засе́ли — засели́
заспориться = заспо́риться — заспори́ться
засыпать = засы́пать — засыпа́ть
засыпаться = засы́паться — засыпа́ться
затыкать = заты́кать — затыка́ть
здорово = здо́рово — здоро́во
зимы = зи́мы — зимы́
змеи = зме́и — змеи́
знаком = зна́ком — знако́м
избегать = избе́гать — избега́ть
избегаться = избе́гаться — избега́ться
извести = и́звести — извести́
икать = и́кать — ика́ть
ирис = и́рис — ири́с
капельный = ка́пельный — капе́льный
качка = ка́чка — качка́
кирка = ки́рка — кирка́
киса = ки́са — киса́
клещи = кле́щи — клещи́
клубы = клу́бы — клубы́
козлы = ко́злы — козлы́
коне = ко́не — коне́
колки = ко́лки — колки́
коробок = коро́бок — коробо́к
косит = ко́сит — коси́т
косите = ко́сите — коси́те
кости = ко́сти — кости́
кредит = кре́дит — креди́т
кружка = кру́жка — кружка́
кружки = кру́жки — кружки́
крыла = кры́ла — крыла́
кулачки = кула́чки — кулачки́
леса = ле́са — леса́
лесок = ле́сок — лесо́к
лиса = ли́са — лиса́
луга = лу́га — луга́
лука = лу́ка — лука́
мала = ма́ла — мала́
мало = ма́ло — мало́
мела = ме́ла — мела́
меньшинства = меньши́нства — меньшинства́
места = ме́ста — места́
мести = ме́сти — мести́
метчик = ме́тчик — метчи́к
меха = ме́ха — меха́
миловать = ми́ловать — милова́ть
милую = ми́лую — милу́ю
мудрёно = мудрёно — мудрено́
мука = му́ка — мука́
милую = ми́лую — милу́ю
набухать = набу́хать — набуха́ть
надсыпать = надсы́пать — надсыпа́ть
накликать = накли́кать — наклика́ть
нападать = напа́дать — напада́ть
нарезать = наре́зать — нареза́ть
нарезаться = наре́заться — нареза́ться
начала = нача́ла — начала́
начало = нача́ло — начало́
носите = но́сите — носи́те
пекло = пе́кло — пекло́
оббегать = оббе́гать — оббега́ть
обегать = обе́гать — обега́ть
обрезание = обре́зание — обреза́ние
обрезаться = обре́заться — обреза́ться
обсыпать = обсы́пать — обсыпа́ть
обсыпаться = обсы́паться — обсыпа́ться
одержим = оде́ржим — одержи́м
орган = о́рган — орга́н
орды = о́рды — орды́
особь = о́собь — осо́бь
осыпать = осы́пать — осыпа́ть
осыпаться = осы́паться — осыпа́ться
отбегать = отбе́гать — отбега́ть
отмерять = отме́рять — отмеря́ть
отруб = о́труб — отру́б
отсыпать = отсы́пать — отсыпа́ть
отсыпаться = отсы́паться — отсыпа́ться
пайки = па́йки — пайки́
пали = па́ли — пали́
парить = па́рить — пари́ть
паром = па́ром — паро́м
пахнуть = па́хнуть — пахну́ть
перед = пе́ред — перёд
перепадать = перепа́дать — перепада́ть
печи = пе́чи — печи́
пили = пи́ли — пили́
пилите = пи́лите — пили́те
пища = пи́ща — пища́
плачу = пла́чу — плачу́
подпть = по́дпть — пода́ть
полы = по́лы — полы́
пола = по́ла — пола́
полки = по́лки — полки́
пора = по́ра — пора́
порты = по́рты — порты́
поручи = по́ручи — поручи́
потом = по́том — пото́м
постели = посте́ли — постели́
пошло = по́шло — пошло́
почесть = по́честь — поче́сть
правило = пра́вило — прави́ло
привод = при́вод — приво́д
пристав = при́став — приста́в
пристань = при́стань — приста́нь
пробегать = пробе́гать — пробега́ть
провиденте = прови́денте — провиде́ние
провод = про́вод — прово́д
проволочка = про́волочка — проволо́чка
промокнуть = промо́кнуть — промокну́ть
пропасть = про́пасть — пропа́сть
просите = про́сите — проси́те
простынь = про́стынь — просты́нь
пряди = пря́ди — пряди́
пчёлы = пчёлы — пчелы́
размыкать = размы́кать — размыка́ть
размыкаться = размы́каться — размыка́ться
разрезать = разре́зать — разреза́ть
расыпать = расы́пать — рассыпа́ть
рака = ра́ка — рака́
реки = ре́ки — реки́
роды = ро́ды — роды́
руки = ру́ки — руки́
руна = ру́на — руна́
рыси = ры́си — на рыси́
на рысях = на ры́сях — на рыся́х
самого = са́мого — самого́
сбегать = сбе́гать — сбега́ть
сведение = све́дение — сведе́ние
свечи = све́чи — свечи́
свиньи = сви́ньи — свиньи́
свойство = сво́йство — свойство́
села = се́ла — села́
сели = се́ли — сели́
село = се́ло — село́
синее = си́нее — сине́е
скачка = ска́чка — скачка́
скликать = скли́кать — склика́ть
слова = сло́ва — слова́
смычка = смы́чка — смычка́
соли = со́ли — соли́
сорок = со́рок — соро́к
сорока = соро́ка — сорока́
спешить = спе́шить — спеши́ть
спина = спи́на — спина́
срезать = сре́зать — среза́ть
стада = ста́да — стада́
стены = сте́ны — стены́
стёкла = стёкла — стекла́
стога = сто́га — стога́
стоит = сто́ит — стои́т
стороны = сто́роны — стороны́
стоящий = сто́ящий — стоя́щий
страны = стра́ны — страны́
стрелка = стре́лка — стрелка́
стрелки = стре́лки — стрелки́
стрелку = стре́лку — стрелку́
судьи = су́дьи — судьи́
сужу = су́жу — сужу́
сыром = сы́ром — сыро́м
тени = те́ни — тени́
тёлка = тёлка — телка́
тёлкам = тёлкам — телка́м
тёлке = тёлке — о телке́
тёлки = тёлки — телки́
тёлок = тёлок — тело́к
тёлку = тёлку — телку́
тикать = ти́кать — тика́ть
толки = то́лки — толки́
торги = то́рги — торги́
транспорт = тра́нспорт — транспо́рт
трезвение = тре́звение — трезве́ние
трусы = тру́сы — трусы́
туши = ту́ши — туши́
углублен = углу́блен — углублён
угольный = у́гольный — уго́льный
уже = у́же — уже́
ужин = у́жин — ужи́н
ужинать = у́жинать — ужина́ть
узнают = узна́ют — узнаю́т
усыпать = усы́пать — усыпа́ть
утопать = уто́пать — утопа́ть
уточка = у́точка — уто́чка
уха = у́ха — уха́
учите = у́чите — учи́те
хвалите = хва́лите — хвали́те
хлопок = хло́пок — хлопо́к
хоры = хо́ры — хоры́
хромом = хро́мом — хромо́м
целить = це́лить — цели́ть
целую = це́лую — целу́ю
чека = че́ка — чека́
чёрта = чёрта — черта́
чудно = чу́дно — чудно́

---
Валя = Ва́ля — валя́
Вари = Ва́ри — вари́
Коли = Ко́ли — коли́
Машин = Ма́шин — маши́н
Машина = Ма́шина — маши́на
Мила = Ми́ла — мила́
Паша = Па́ша — паша́
Тома = То́ма — тома́
Александров = Алекса́ндров — Александро́в
Иванов = Ива́нов — Ивано́в
Козак = Ко́зак — Коза́к
панки = па́нки — Панки́
Перу = Пе́ру — перу́
вахтёр = вахтёр — ва́хтер
набело = на́бело — набело́
настороженный = насторо́женный — насторожённый
пригоршня = при́горшня — приго́ршня
пролил = про́лил — проли́л
пролило = про́лило — проли́ло
пролитый = про́литый — проли́тый
пролит = про́лит — проли́т
пролито = про́лито — проли́то
творог = тво́рог — творо́г
возбужден = возбу́жден — возбуждён
осужден = осу́жден — осуждён
не пудри мозги = не пудри мозги́ — не пудри мо́зг
слабо = сла́бо — слабо́


https://wiki.openoffice.org/wiki/Talk:Spellchecker_Integration_into_Installation_Set
Общаюсь с каждой персоной только на ты вне зависимости от возраста и сексуальной ориентации (М или Ж) -- в единственном лице (даже если у кого-то коллективный аккаунт или аватар): у меня в глазах не двоится и не мерещится -- не трепите себе нервы упрёками и выканиями.

AllPo

Общаюсь с каждой персоной только на ты вне зависимости от возраста и сексуальной ориентации (М или Ж) -- в единственном лице (даже если у кого-то коллективный аккаунт или аватар): у меня в глазах не двоится и не мерещится -- не трепите себе нервы упрёками и выканиями.

Yakov

Предлагается помечать эти слова как неправильные с заменой на предлагаемые варианты?

rami

Из этого списка можно смело удалять слова с ё, т.к. ё практически всегда ударная

tagezi

Цитата: AllPo от  6 октября 2015, 15:46Needs to be replaced - in checking the spelling and grammar of the Russian language, multi-valued terms and words without special emphasis on - two words with the correct accents of letters.
Эм.. предполагается что кто-то тут владеет русским языком  настолько плохо? )

Цитата: AllPo от  6 октября 2015, 15:46Необходимо заменить -- в проверке грамматики и орфографии русского языка, многозначные термины и слова без специального ударения, на -- два слова с правильными ударениями над буквами.
Если честно, не вижу смысла, так как буквы от этого не меняются, а фонетическая составляющая понятна из контекста предложения.
(x86_64) Kubuntu 16.04.3 - LibreOffice 6.0.2 / 6.1 alpha

AllPo

Цитата: tagezi от  6 октября 2015, 20:28Если честно, не вижу смысла, так как буквы от этого не меняются, а фонетическая составляющая понятна из контекста предложения.

Думаешь? А если нет предложения? Или... если предложение состоит из одного или пары слов? Что если не  контекста? Проблема в том, что и ударения поставить не получается без лишних заморочек в русских словах. Не предусмотрено,.. как было не предусмотрено и с буквой Ё совсем недавно.
Общаюсь с каждой персоной только на ты вне зависимости от возраста и сексуальной ориентации (М или Ж) -- в единственном лице (даже если у кого-то коллективный аккаунт или аватар): у меня в глазах не двоится и не мерещится -- не трепите себе нервы упрёками и выканиями.

AllPo

Цитата: tagezi от  6 октября 2015, 20:28предполагается что кто-то тут владеет русским языком  настолько плохо? )
Предполагается что программу в основном создают не владеющие русской словесностью в полной и даже частичной мере, но посещают и интересуются. Мне зачастую отвечают по этому поводу о перестановки клавиатуры с латиницы на кириллицу, как будто это что-то изменит с ударениями в словах. Они-то не понимают, что этого ещё нет в программах. Писали-то их нерусские, а русскоговорящие делали переводы уже потом и приспосабливались. Кстати, и на этом форуме не предусмотрено проставить знак ударения к слову "потом".
Общаюсь с каждой персоной только на ты вне зависимости от возраста и сексуальной ориентации (М или Ж) -- в единственном лице (даже если у кого-то коллективный аккаунт или аватар): у меня в глазах не двоится и не мерещится -- не трепите себе нервы упрёками и выканиями.

AllPo

Цитата: rami от  6 октября 2015, 17:57Из этого списка можно смело удалять слова с ё, т.к. ё практически всегда ударная
А для таких слов ударение и не ставится. Если они и продемонстрированы частично, то только для того, чтобы продемонстрировать наличие некой неточности в имеющихся приложениях программы.
Общаюсь с каждой персоной только на ты вне зависимости от возраста и сексуальной ориентации (М или Ж) -- в единственном лице (даже если у кого-то коллективный аккаунт или аватар): у меня в глазах не двоится и не мерещится -- не трепите себе нервы упрёками и выканиями.

AllPo

Цитата: Yakov от  6 октября 2015, 17:17Предлагается помечать эти слова как неправильные с заменой на предлагаемые варианты?
В индивидуальном порядке или при создании и редактировании программы и приложений к ней? У программы нет соединения с единым сервером для накопления информации от пользователей по этому случаю, а было бы прикольно.
Общаюсь с каждой персоной только на ты вне зависимости от возраста и сексуальной ориентации (М или Ж) -- в единственном лице (даже если у кого-то коллективный аккаунт или аватар): у меня в глазах не двоится и не мерещится -- не трепите себе нервы упрёками и выканиями.

tagezi

Цитата: AllPo от  6 октября 2015, 22:48Думаешь? А если нет предложения? Или... если предложение состоит из одного или пары слов?
Если документ состоит из одного или пары слов...

Yakov, если вдруг вы решите добавить проверку ударения в расширение, можно это сделать через какую-нибудь галочку? Дело в том, что то у меня не бывает документов из одного слова и я очень редко (то есть никогда) пишу книги в ЛО для первоклашек. В остальных текстах, лично для меня, они не имеют смысла.
(x86_64) Kubuntu 16.04.3 - LibreOffice 6.0.2 / 6.1 alpha

Yakov

Скорей всего это можно будет реализовать как отдельный словарь-расширение в формате UTF-8.
Существующие словари сделаны в однобайтовых кодировках, и для реализации этой функции их бы пришлось переводить в UTF-8, что увеличивает потребляемую память спеллчекером в 2 раза и уменьшает скорость проверки в 2 раза.

tagezi

Цитата: Yakov от  7 октября 2015, 08:27Скорей всего это можно будет реализовать как отдельный словарь-расширение в формате UTF-8.
Существующие словари сделаны в однобайтовых кодировках, и для реализации этой функции их бы пришлось переводить в UTF-8, что увеличивает потребляемую память спеллчекером в 2 раза и уменьшает скорость проверки в 2 раза.
Не важно как, главное чтобы по умолчанию было нормально, то есть без ударения, а не как "система верстки книжек для начальной школы".
Всё что не по умолчанию, может быть как угодно, хоть с переводом на "олбанский" в 32 байтовой коровке.
(x86_64) Kubuntu 16.04.3 - LibreOffice 6.0.2 / 6.1 alpha

Yakov

Как вариант –  решение проблемы с помощью LightProof.
Слова подчёркиваются синей волнистой линией, если в настройках расширения включить опцию "Ударение".

Yakov

#13
В процессе тестирования обнаружил, что слова с ударением не распознаются стандартным словарём.

То есть надо дополнительно вносить все предложенные слова в словарь, либо настраивать словарь так, чтобы он игнорировал знак ударения,
либо дополнительно в словарь вносить все слова с ударениями.

tagezi

Цитата: Yakov от 15 октября 2015, 06:04В процессе тестирования обнаружил, что слова с ударением не распознаются стандартным словарём.
Орфографический словарь и не должен распознавать фонетические конструкции. Это как в английском распознавалось бы ˈtaib(ə)l как table.
(x86_64) Kubuntu 16.04.3 - LibreOffice 6.0.2 / 6.1 alpha