Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

Форум поддержки пользователей. LibreOffice, Apache OpenOffice, OpenOffice.org

8 Декабрь 2021, 23:06 *
Добро пожаловать, Гость. Пожалуйста, войдите или зарегистрируйтесь.
Вам не пришло письмо с кодом активации?

Войти
Новости: Часто задаваемые вопросы по LibreOffice и Apache OpenOffice.org
 
   Начало   Помощь Поиск Войти Регистрация    задать вопрос  
Страниц: 1   Вниз
  Печать  
Автор Тема: объединение двух файлов  (Прочитано 1476 раз)
0 Пользователей и 1 Гость смотрят эту тему.
Jokersun90
Участник
**
Offline Offline

Сообщений: 10


« Стартовое сообщение: 20 Январь 2020, 11:15 »

Здравствуйте уважаемые форумчане!  Всё хорошо
Сегодня столкнулся с проблемой объединения двух файлов в calc с удалением одинаковых строк  Непонимающий
Суть задачи состоит в том что интегрировать один список в другой но так что одинаковые строки не копировались Да уж...
Например есть документ А и документ Б ,в них есть списки доменов .В списке Б есть домены которые могут повторятся с теми что в списке А,но мне этого не надо. Да,можно использовать поиск и проверять в ручную,но в этих списках примерно по 9к строк  Злой а в день может проверяться около 10 таких списко Да уж...
Может кто знает как автоматизировать этот процесс?  Плачущий


* список А.png (176.05 Кб, 2646x1024 - просмотрено 12 раз.)

* список Б.png (162.85 Кб, 2646x1024 - просмотрено 9 раз.)
Записан
rami
Гуру
*******
Offline Offline

Пол: Мужской
Сообщений: 3 118


iMac, LibreOffice и Apache OpenOffice


« Ответ #1: 20 Январь 2020, 12:28 »

Посмотрите тему Удалить дубликаты, там в первом посте есть ссылка на сайт с расширением.

Были и другие подобные темы.
Записан

economist
Форумчанин
***
Offline Offline

Сообщений: 1 568


« Ответ #2: 20 Январь 2020, 12:52 »

можно использовать поиск и проверять в ручную,но в этих списках примерно по 9к строк  Злой а в день может проверяться около 10 таких списко

Это уже с серьезные объемы для анализа и вопрос выбора инструмента. Призываю рассмотреть все вар-ты. Лаконично и быстро это сделает язык Python (файл с расширением .py):

Код:
import pandas as pd
a=pd.read_csv(путькфайлу_a)
b=pd.read_csv(путькфайлу_b)
a=a.concat(b)
a.drop_duplicates(inplace=True)
a.to_csv(путькфайлу_с)

Обратите внимание - насколько понятен этот незнакомый код. Запустить такой файл можно со свободным языком Python или тем питоном, что есть "под капотом" в OpenOffice|LibreOffice (файл python.exe внутри офиса)
Записан

Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...
Jokersun90
Участник
**
Offline Offline

Сообщений: 10


« Ответ #3: 20 Январь 2020, 20:24 »

Спасибо всем. У вас очень гостеприимный и отзывчивый форум,если честно я даже удивлен,обычно плявляются умники... Всех благ.
Записан
Страниц: 1   Вверх
  Печать  
 
Перейти в:  

Powered by MySQL Powered by PHP Powered by SMF 1.1.21 | SMF © 2006-2009, Simple Machines Valid XHTML 1.0! Valid CSS!