Inicio > Procesamiento y búsqueda de texto > uniq

Guía del comando uniq: Eliminar y verificar líneas duplicadas

El comando `uniq` se utiliza para eliminar líneas duplicadas consecutivas o para contar el número de líneas duplicadas en un archivo de texto o datos pasados a través de una tubería. Su verdadero valor se revela cuando se usa junto con el comando `sort`, siendo una herramienta esencial para la limpieza y análisis de datos.

Visión general del comando uniq

`uniq` es la abreviatura de 'unique' (único) y realiza la función de encontrar y procesar líneas duplicadas dentro de un archivo. Un punto importante aquí es que `uniq` solo procesa **líneas duplicadas consecutivas**. Por lo tanto, para eliminar duplicados de todo el archivo, primero debe ordenar los datos utilizando el comando `sort`.

Cómo funciona uniq

El comando uniq lee las líneas de entrada una por una y las compara con la línea anterior. Si las dos líneas son iguales, se consideran duplicadas; si no, se consideran una nueva línea única. Debido a este proceso, para eliminar duplicados de todo el archivo, es imprescindible que el proceso de ordenar el archivo con el comando `sort` se realice previamente.

Opciones principales

Puede realizar tareas detalladas como eliminar duplicados, contar o imprimir líneas específicas utilizando las diversas opciones del comando `uniq`.

1. Funcionalidad básica

2. Control de método de comparación

Comando generado:

Combina los comandos.

Descripción:

`uniq` Ejecutando el comando.

Combina las opciones anteriores para ejecutar virtualmente los comandos junto con la IA.

Ejemplos de uso frecuente

Aprenda a procesar datos de manera efectiva utilizando `uniq` junto con `sort`.

Eliminar líneas duplicadas de todo el archivo

sort data.txt | uniq

Ordena el archivo `data.txt` con `sort` y luego elimina las líneas duplicadas de todo el archivo con `uniq`. Esta combinación es el uso más común.

Mostrar líneas duplicadas y su conteo

sort data.txt | uniq -c

Elimina las líneas duplicadas del archivo `data.txt` y muestra cada línea junto con el número de veces que aparece.

Mostrar solo líneas duplicadas de todo el archivo

sort data.txt | uniq -d

Imprime solo las líneas que aparecen dos o más veces en el archivo `data.txt`.

Mostrar solo líneas únicas que aparecen una sola vez en todo el archivo

sort data.txt | uniq -u

Imprime solo las líneas que no están duplicadas y aparecen una sola vez en el archivo `data.txt`.

Eliminar duplicados ignorando un campo específico

sort log.txt | uniq -f 1

Elimina duplicados de un archivo de registro ignorando la información de tiempo (el primer campo) y basándose solo en el contenido restante.


comandos relacionados

Son comandos que son funcionalmente similares o que se usan juntos con frecuencia.


Comandos de la misma categoría