есть фаил на 28000 строк, там как мужчины так и женщины, уш...

Автор ForumOOo (бот), 31 мая 2016, 11:25

0 Пользователи и 1 гость просматривают эту тему.

ForumOOo (бот)

Компонент: Calc
Версия продукта: 4.x
Сборка: Apache OpenOffice 4.1.1
ОС: win 10

есть фаил на 28000 строк, там как мужчины так и женщины, ушло очень много времени на то что бы удалить мужчин и остались только женщины
теперь мне нужно сделать второй фаил только с мужчинами, могу ли я как то из общего файла, удалить дубли тех женщин, что находятся в общем
файле так, что бы остались только мужчины?

--
Подпись: Alexandr Perov
Эл. почта: perov83@gmail.com

JohnSUN

Да, Александр, это не сложно

А в чем была трудность отбора женщин? Не было полных отчеств? Обычно эта задача решается за пару минут с помощью анализа последней буквы отчества - женщины норовят своё отчество заканчивать на "а", а мужчины - на "ч"
Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне

v-iskan

Цитата: JohnSUN от 31 мая 2016, 09:37А в чем была трудность отбора женщин? Не было полных отчеств? Обычно эта задача решается за пару минут с помощью анализа последней буквы отчества - женщины норовят своё отчество заканчивать на "а", а мужчины - на "ч"
Дело в том что указано полностью ФИО и зачастую есть женские имена которые заканчиваются так же как фамилии у мжчин а есть и на оборот а ще те которые вовсе не склоняются. Основной массив конечно так и делал но потом прогонял по конкретным именам через бинокль найти все удалить ячейки строки целиком

JohnSUN

Нет-нет, я говорил об анализе последней буквы не ФАМИЛИИ, а ОТЧЕСТВА - там неоднозначностей гораздо меньше. Ну, разве что какая-нибудь "кызы" или какой-нибудь "оглы" подпортят статистику...
Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне

v-iskan

Цитата: JohnSUN от 31 мая 2016, 09:37Да, Александр, это не сложно

Владислав, что-то как-то все сложно там куда Вы меня отправили. А есть ли возможность сделать так, на первом листе файла общий список, на втором женщины, запускаем формулу или функцию которая выделяет на первом листе (в общем списке) ячейки с теми же значениями, что на том листе где только женщины. А потом все просто на выделенную ячейку останется ПКМ-удалить ячейки-полностью строки и все!
Просто дело в том что столбец ФИО не единственный есть еще столбец с цифрами и столбец с примечаниями

JohnSUN

Ну да, обычно эта задача так и формулируется
Цитата: v-iskan от 31 мая 2016, 12:13
на первом листе файла общий список, на втором женщины, запускаем формулу или функцию которая выделяет на первом листе (в общем списке) ячейки с теми же значениями, что на том листе где только женщины.
В начале той темы, по ссылке которая, три шаблона формул для вспомогательного столбца... Ну, рядом с общим списком на первом листе в свободной ячейке во второй строке пишем что-то вроде
=SUMPRODUCT($Лист2.$A$1:$A$14000=B2;$Лист2.$B$1:$B$14000=C2)=1
Ну, буквы колонок нужно подправить по реальным данным. Здесь предполагалось, что на первом (текущем) листе в колонке B содержаться фамилии, а в колонке C - имена-отчества, а на втором листе эти значения находятся в колонках A и B.
Выделяем ячейку с этой формулой, жмем Ctrl+Shift+End и Ctrl+D (заполняем всю колонку этой формулой).
А потом можем, например, отсортировать весь список по этой колонке, выделить ячейки со значением ИСТИНА и нажать Shift+Пробел (выделить строки) и Ctrl+Minus (удалить выделенные строки)
Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне

v-iskan

Цитата: JohnSUN от 31 мая 2016, 10:26Ну, буквы колонок нужно подправить по реальным данным. Здесь предполагалось, что на первом (текущем) листе в колонке B содержаться фамилии, а в колонке C - имена-отчества, а на втором листе эти значения находятся в колонках A и B.

А если на обоих листах проверяемые данные содержаться в коленке А то как тогда формула будет выглядеть? А то по этой формуле у меня на всю длину ЛОЖЬ получается

JohnSUN

А, если всё ФИО в "коленке A", то формула намного проще:
=COUNTIF($Лист2.$A$1:$A$28000;A2)>0
Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне

v-iskan

Так отлично часть работы сделал Истина Ложь выявил. Спасибо вам Владислав. Теперь не пойму как отсортировать эти ложь и истина

JohnSUN

Ctrl+Home - прыгнуть в ячейку A1
Ctrl+Shift+End - прыгнуть в последнюю заполненную ячейку, попутно выделив всю таблицу
Меню Данные-Сортировать, указать для сортировки нужную колонку и ОК
Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне

v-iskan

Отлично большущее спасибо Владислав. Дай Бог Вам здоровья!

v-iskan

Цитата: JohnSUN от 31 мая 2016, 10:26В начале той темы, по ссылке которая, три шаблона формул для вспомогательного столбца... Ну, рядом с общим списком на первом листе в свободной ячейке во второй строке пишем что-то вроде
Код:
=SUMPRODUCT($Лист2.$A$1:$A$14000=B2;$Лист2.$B$1:$B$14000=C2)=1
Ну, буквы колонок нужно подправить по реальным данным. Здесь предполагалось, что на первом (текущем) листе в колонке B содержаться фамилии, а в колонке C - имена-отчества, а на втором листе эти значения находятся в колонках A и B.

Владислав добрый день помогите пожалуйста.
Как будет выглядеть формула если - ФИО находится в 3-х столбцах на обоих листах. На текущем 69769 строк, а на втором 24680 строк. Нужно чтобы сверка шла по сочетанию всех 3-х столбцов (так как Вы конечно же понимаете что могут быть однофамильцы и тезки)

=SUMPRODUCT($Лист2.$A$1:$A$69769=A2;$Лист2.$B$1:$B$69769=B2;$Лист2$.$C$1:$C$69769=C2)=1

economist

#12
Помимо "однофамильцы и тезки" - есть еще и третья подобная сущность: дубликаты самого себя.

Определение пола невозможно автоматизировать для ФИО без отчеств:  Азнив Ога

Определение пола невозможно автоматизировать для азиатов:  Ю И, Ё Ы (у нас такой трудится!)

Определение пола трудно автоматизируемо для Кызы, Оглы, Ака, Ога итп.

Но таких - не более 0,1%, скажем по спискам из 100 тыс. (ПФР, юг страны).

Кстати, раз уж видел эту базу - поделюсь "радостью": неправильно вручную был выбран пол у 200 человек (0,2%). Это говорит о том, то что милые толстые тетки проедают деньги будущих пенсионеров зря и искренне верят в недожитие 90% их до "возраста дожития" после увеличения пенсионного возраста на +5 лет (до 70+).  
Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...

JohnSUN

Цитата: v-iskan от  7 ноября 2016, 10:04
Как будет выглядеть формула...
=SUMPRODUCT($Лист2.$A$1:$A$69769=A2;$Лист2.$B$1:$B$69769=B2;$Лист2$.$C$1:$C$69769=C2)=1
Именно так она и будет выглядеть. Ну, разве что вместо =1 лучше указать >0 - а то ведь, действительно, найдет двух однофамильцев, а 2 <> 1 и результат будет не тот, что ожидался
Владислав Орлов aka JohnSUN
Благодарить-не зазорно.
Подарить благо создателям офиса, нашему ресурсу, мне