Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

23 Июнь 2017, 16:51 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
Новости: Доступно и просто о работе в офисных пакетах
 
   Начало   Помощь Поиск Войти Регистрация    задать вопрос  
Страниц: 1   Вниз
  Печать  
Автор Тема: Обычное сравнение 2х столбцов  (Прочитано 599 раз)
0 Пользователей и 1 Гость смотрят эту тему.
AlexSher
Новичок
*
Offline Offline

Сообщений: 4


« Стартовое сообщение: 19 Апрель 2017, 13:15 »

Здравствуйте.
Подскажите, помогите кто знает  Непонимающий

Есть ключевые слова, больше 11000 в одной колонке и около 2000 в другой колонке. Даже не слова а фразы где много слов.

Нужно сравнить не пересекаются ли они. Не совпадают ли полностью.

Те которые пересеклись, по возможности либо выписать рядом в колонку, либо выделить как-то... лучше выписать наверное.

Записан
JohnSUN
Капитана в тот день называли на "ты"
Гуру
*******
Offline Offline

Пол: Мужской
Расположение: Киев
Сообщений: 2 275


Помогаю людям и компьютерам понимать друг друга


WWW
« Ответ #1: 19 Апрель 2017, 13:23 »

Добро пожаловать на форум, AlexSher!
Количество значений не существенно, это может сказаться только на проворстве офиса - ну, чуть дольше ждать результата, делов-то!
Хотелось бы увидеть образец этих данных - штук 50 ключевых слов и с десяток фраз с разными вариантами совпадений. Можете приложить такой файл?
Записан

Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне
AlexSher
Новичок
*
Offline Offline

Сообщений: 4


« Ответ #2: 19 Апрель 2017, 13:33 »

Спасибо за ответ!
Да, вот накидал пример.
В третьей колонке пометил те которые должны совпадать.

* Сравнение ключевых слов.ods (19.96 Кб - загружено 6 раз.)
Записан
JohnSUN
Капитана в тот день называли на "ты"
Гуру
*******
Offline Offline

Пол: Мужской
Расположение: Киев
Сообщений: 2 275


Помогаю людям и компьютерам понимать друг друга


WWW
« Ответ #3: 19 Апрель 2017, 14:01 »

Ну, с полным совпадением всё понятно, это не сложно
Для начала нужно бы слегка почистить данные - удалить дубли из "наших ключей" и из "чужих ключей". Проще всего это сделать с помощью Стандартного фильтра (на картинке).
А потом совсем просто - объединяем данные двух массивов (просто дописываем чужие ключи в тот же столбец), в соседней колонке пишем
Код:
=COUNTIF(A:A;A2)
(эта формула сообщит, сколько раз значение из ячейки встречается в колонке), растягиваем формулу до конца данных (Ctrl+Shift+End и Ctrl+D) и опять применяем фильтр - отбираем записи, которые встретились больше одного раза.

Но это точное совпадение. А что имелось в виду под "пересечением"?


* Убрать дубли.png (101.44 Кб, 909x640 - просмотрено 11 раз.)
Записан

Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне
AlexSher
Новичок
*
Offline Offline

Сообщений: 4


« Ответ #4: 19 Апрель 2017, 14:25 »

Спасибо за помощь!

Но этот вариант не совсем подойдет.

1) Когда я пытаюсь удалить дубли, у меня выходит очень много фраз, они по факту повторяются друг в друге + еще слова.
Это как бы разные ключи. Если они в рамках одной компании.
Например: "грузоперевозки Новосибирск" и "грузоперевозки Новосибирск цена" и "грузоперевозки Новосибирск транспортная компания" - если они в рамках одной компании то это все правильно, они не дубликаты, а разные ключи.

Вот если бы так сравнивалось между 2мя столбцами, между двумя списками ключей - это было бы здорово, т.к. там они похорошему вообще не должны пересекаться.



2) Если вывести напротив каждого ключа, цифру сколько раз она повторяется, то мне придется листать о конца список с 13000+ строк.
Или как то еще упорядочить? оставить те, которые более 2х раз употребляются ?
Записан
JohnSUN
Капитана в тот день называли на "ты"
Гуру
*******
Offline Offline

Пол: Мужской
Расположение: Киев
Сообщений: 2 275


Помогаю людям и компьютерам понимать друг друга


WWW
« Ответ #5: 19 Апрель 2017, 15:15 »

Об удалении дублей я заговорил по той простой причине, что в образце эти самые дубли встретились ("ж д доставка грузов" и "компании грузоперевозок" по два раза, а "ответственное хранение" встретилось трижды в колонке A). При моём способе определения совпадающих фраз эти строки вызвали бы ложное срабатывание и привели бы к неправильному результату.
Если вывести напротив каждого ключа, цифру сколько раз она повторяется, то мне придется листать о конца список с 13000+ строк.
Ой, нет! Только не это, шеф, только не это!
Или как то еще упорядочить? оставить те, которые более 2х раз употребляются ?
Совершенно верно! Я именно про это написал
и опять применяем фильтр - отбираем записи, которые встретились больше одного раза.


* Не листай.png (36.13 Кб, 841x369 - просмотрено 6 раз.)
Записан

Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне
rami
Гуру
*******
Offline Offline

Пол: Мужской
Сообщений: 2 101


MacBook Pro, LibreOffice и Apache OpenOffice


« Ответ #6: 19 Апрель 2017, 16:12 »

Давайте попробуем вариант попроще (тоже фильтр, но другой):

1. под заголовками вставьте новую строку и в ячейках A2 и B2 запишите одинаковое слово (например, ключ) см. снимок
2. выделим диапазон A2:A11000 (до низа данных)
3. открываем окно Расширенного фильтра и заполняем:
4. Взять условия фильтра из — выбираем диапазон из столбца B (до низа данных), пишем (B2:B2000)
5. ставим "птички" Без повторений и
6. Копировать результат в: — выбираем адрес начальной ячейки для результата
7. OK

Важно! чтобы фильтр сработал заголовки данных в столбцах A и B должны быть одинаковые (первую строку с вашими заголовками игнорируем).


* Расширенный фильтр.png (269.04 Кб, 1262x506 - просмотрено 18 раз.)
Записан

AlexSher
Новичок
*
Offline Offline

Сообщений: 4


« Ответ #7: 20 Апрель 2017, 12:31 »

Давайте попробуем вариант попроще (тоже фильтр, но другой):

1. под заголовками вставьте новую строку и в ячейках A2 и B2 запишите одинаковое слово (например, ключ) см. снимок
2. выделим диапазон A2:A11000 (до низа данных)
3. открываем окно Расширенного фильтра и заполняем:
4. Взять условия фильтра из — выбираем диапазон из столбца B (до низа данных), пишем (B2:B2000)
5. ставим "птички" Без повторений и
6. Копировать результат в: — выбираем адрес начальной ячейки для результата
7. OK

Важно! чтобы фильтр сработал заголовки данных в столбцах A и B должны быть одинаковые (первую строку с вашими заголовками игнорируем).


Спасибо! Ваш Вариант сработал!


Об удалении дублей я заговорил по той простой причине, что в образце эти самые дубли встретились ("ж д доставка грузов" и "компании грузоперевозок" по два раза, а "ответственное хранение" встретилось трижды в колонке A). При моём способе определения совпадающих фраз эти строки вызвали бы ложное срабатывание и привели бы к неправильному результату.
Если вывести напротив каждого ключа, цифру сколько раз она повторяется, то мне придется листать о конца список с 13000+ строк.
Ой, нет! Только не это, шеф, только не это!
Или как то еще упорядочить? оставить те, которые более 2х раз употребляются ?
Совершенно верно! Я именно про это написал
и опять применяем фильтр - отбираем записи, которые встретились больше одного раза.


Спасибо Вам тоже огромное!
Записан
joshua
Новичок
*
Offline Offline

Сообщений: 44



« Ответ #8: 22 Май 2017, 15:15 »

Возможно уже не актуально, но может кому пригодиться... Показывает язык
Надо просто вставить данные в столбец А и B.
На закладке Result он выдаст те значения столбца В, которые встречаются в А(хотя бы раз)
Если совпадений больше, то надо просто протянуть формулу на закладке Result ниже, до тех пор пока не появиться надпись "...КОНЕЦ СОВПАДЕНИЙ"

* CompareSameNew.ods (101.52 Кб - загружено 0 раз.)

* Compareinfo.JPG (43.69 Кб, 721x567 - просмотрено 13 раз.)
« Последнее редактирование: 22 Май 2017, 15:20 от joshua » Записан
Страниц: 1   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!