accueil > Traitement et recherche de texte > uniq

Guide de la commande uniq : Supprimer et identifier les lignes en double

La commande `uniq` est utilisée pour supprimer les lignes consécutives en double ou pour compter le nombre de lignes en double dans un fichier texte ou des données passées via un pipe. Elle est particulièrement efficace lorsqu'elle est utilisée avec la commande `sort` et constitue un outil essentiel pour le nettoyage et l'analyse des données.

Aperçu de la commande uniq

`uniq` est l'abréviation de 'unique' et a pour fonction de trouver et de traiter les lignes en double dans un fichier. Il est important de noter que `uniq` ne traite que les **lignes consécutives en double**. Par conséquent, pour supprimer les doublons d'un fichier entier, vous devez d'abord trier les données à l'aide de la commande `sort`.

Fonctionnement de uniq

La commande uniq lit les lignes d'entrée une par une et les compare à la ligne précédente. Si les deux lignes sont identiques, elles sont considérées comme des doublons ; sinon, la ligne est considérée comme unique. C'est pourquoi le tri du fichier avec la commande `sort` est une étape préalable indispensable pour supprimer les doublons de l'ensemble du fichier.

Options principales

Utilisez les diverses options de la commande `uniq` pour effectuer des tâches précises telles que la suppression des doublons, le comptage et l'affichage de lignes spécifiques.

1. Fonctionnalités de base

2. Contrôle de la méthode de comparaison

Commande générée :

Essayez de combiner les commandes.

Description:

`uniq` Exécute la commande.

Essayez d'exécuter virtuellement les commandes avec l'IA en combinant les options ci-dessus.

Exemples couramment utilisés

Apprenez à traiter efficacement les données en utilisant `uniq` et `sort` ensemble.

Supprimer les lignes en double de l'ensemble du fichier

sort data.txt | uniq

Trie le fichier `data.txt` avec `sort`, puis supprime les lignes en double de l'ensemble du fichier avec `uniq`. Cette combinaison est l'utilisation la plus courante.

Afficher les lignes en double et leur nombre

sort data.txt | uniq -c

Supprime les lignes en double du fichier `data.txt` et affiche chaque ligne avec le nombre de fois où elle est apparue.

Afficher uniquement les lignes en double de l'ensemble du fichier

sort data.txt | uniq -d

Affiche uniquement les lignes qui sont apparues plus de deux fois dans le fichier `data.txt`.

Afficher uniquement les lignes uniques qui n'apparaissent qu'une seule fois dans l'ensemble du fichier

sort data.txt | uniq -u

Affiche uniquement les lignes qui sont apparues une seule fois et ne sont pas dupliquées dans le fichier `data.txt`.

Supprimer les doublons en ignorant un champ spécifique

sort log.txt | uniq -f 1

Supprime les doublons d'un fichier journal en ignorant les informations de temps (le premier champ) et en ne considérant que le reste du contenu.


commandes associées

Des commandes fonctionnellement similaires ou souvent utilisées ensemble.


Commandes de la même catégorie