Как использовать несколько символов в качестве разделителя?

Автор pavel901, 29 января 2024, 19:20

0 Пользователи и 1 гость просматривают эту тему.

pavel901

У меня очень много строк с данными (100.000+), мне не подходили ;, (и похожие разделители), так как они могут встречаться в данных, поэтому я использовал в качестве разделителя комбинацию символов вроде |^.
Когда я ввел эту комбинацию в поле "Other" при загрузке файла в libreoffice calc, то он начал делить по каждому символу, по отдельности (т. е. везде, где есть "|", "^" и т. д.), а не по связке |^.
Как делать разделение только в тех местах, где встречаются введенные мной символы вместе?

sokol92

В LibreOffice в качестве разделителя полей допускается только один символ.
Можно рассмотреть возможность использования знака табуляции - в некоторых данных такого знака нет.
Владимир.

mikekaganski

Цитата: sokol92 от 29 января 2024, 20:02Можно рассмотреть возможность использования знака табуляции - в некоторых данных такого знака нет.

А лучше воспользоваться правилами CSV, и маскировать символы, которые используются в качестве разделителей.
С уважением,
Михаил Каганский

economist

Tab CHR(12) почти всегда лучший разделитель, его невозможно ввести в диалогах с клавиатуры, поэтому корпорация 1С использует его. Если данные всё-таки содержит мусорный таб - это верный признак кривых "погромистов", написавших обмен с ошибками.

Объем строк в 100k - большой, рассмотрите очистку данных и превращение в ods с помощью Pandas с Python. На Форуме несколько примеров, включая обработку файлов из папок с объединением в один и фильтрацией нужных строк.
Руб. за сто, что Питоньяк
Любит водку и коньяк!
Потому что мне, без оных, -
Не понять его никак...

pavel901

Спасибо за идею с табуляцией, как-то не подумал сразу об этом. Получилось.