Главная > Обработка текста и поиск > uniq

Руководство по команде uniq: удаление и проверка повторяющихся строк

Команда `uniq` используется для удаления последовательно повторяющихся строк или подсчета их количества в текстовых файлах или данных, переданных через пайп. Она наиболее эффективна в сочетании с командой `sort` и является незаменимым инструментом для очистки и анализа данных.

Обзор команды uniq

`uniq` — это сокращение от 'unique' (уникальный), и она выполняет поиск и обработку повторяющихся строк в файле. Важно отметить, что `uniq` обрабатывает только **последовательно повторяющиеся строки**. Поэтому для удаления дубликатов из всего файла необходимо сначала отсортировать данные с помощью команды `sort`.

Принцип работы uniq

Команда uniq построчно считывает входные данные и сравнивает каждую строку с предыдущей. Если две строки одинаковы, они считаются дубликатами; если нет — новая строка считается уникальной. Из-за этого процесса для удаления дубликатов из всего файла необходимо предварительно отсортировать файл с помощью команды `sort`.

Основные опции

Используя различные опции команды `uniq`, вы можете выполнять детальные операции, такие как удаление дубликатов, подсчет и вывод определенных строк.

1. Основные функции

2. Управление методом сравнения

Сгенерированная команда:

Комбинируйте команды.

Описание:

`uniq` Запускает команду.

Комбинируйте эти опции, чтобы виртуально выполнять команды с помощью ИИ.

Часто используемые примеры

Узнайте, как эффективно обрабатывать данные, используя `uniq` вместе с `sort`.

Удаление дубликатов строк из всего файла

sort data.txt | uniq

Сортирует файл `data.txt` с помощью `sort`, а затем удаляет все дублирующиеся строки из файла с помощью `uniq`. Это наиболее распространенный способ использования.

Вывод повторяющихся строк с количеством

sort data.txt | uniq -c

Удаляет повторяющиеся строки из файла `data.txt` и выводит каждую строку с количеством ее вхождений.

Вывод только повторяющихся строк из всего файла

sort data.txt | uniq -d

Выводит только строки, которые встречаются два или более раз в файле `data.txt`.

Вывод только уникальных строк, встречающихся один раз во всем файле

sort data.txt | uniq -u

Выводит только строки, которые не повторяются и встречаются только один раз в файле `data.txt`.

Удаление дубликатов с игнорированием определенных полей

sort log.txt | uniq -f 1

Игнорирует информацию о времени (первое поле) в файле журнала и удаляет дубликаты только по оставшемуся содержимому.


Связанные команды

Функционально схожие или часто используемые команды.


Те же команды в категории