Visión general del comando uniq
`uniq` es la abreviatura de 'unique' (único) y realiza la función de encontrar y procesar líneas duplicadas dentro de un archivo. Un punto importante aquí es que `uniq` solo procesa **líneas duplicadas consecutivas**. Por lo tanto, para eliminar duplicados de todo el archivo, primero debe ordenar los datos utilizando el comando `sort`.
Cómo funciona uniq
El comando uniq lee las líneas de entrada una por una y las compara con la línea anterior. Si las dos líneas son iguales, se consideran duplicadas; si no, se consideran una nueva línea única. Debido a este proceso, para eliminar duplicados de todo el archivo, es imprescindible que el proceso de ordenar el archivo con el comando `sort` se realice previamente.
Opciones principales
Puede realizar tareas detalladas como eliminar duplicados, contar o imprimir líneas específicas utilizando las diversas opciones del comando `uniq`.
1. Funcionalidad básica
2. Control de método de comparación
Comando generado:
Combina los comandos.
Descripción:
`uniq` Ejecutando el comando.
Combina las opciones anteriores para ejecutar virtualmente los comandos junto con la IA.
Ejemplos de uso frecuente
Aprenda a procesar datos de manera efectiva utilizando `uniq` junto con `sort`.
Eliminar líneas duplicadas de todo el archivo
sort data.txt | uniq
Ordena el archivo `data.txt` con `sort` y luego elimina las líneas duplicadas de todo el archivo con `uniq`. Esta combinación es el uso más común.
Mostrar líneas duplicadas y su conteo
sort data.txt | uniq -c
Elimina las líneas duplicadas del archivo `data.txt` y muestra cada línea junto con el número de veces que aparece.
Mostrar solo líneas duplicadas de todo el archivo
sort data.txt | uniq -d
Imprime solo las líneas que aparecen dos o más veces en el archivo `data.txt`.
Mostrar solo líneas únicas que aparecen una sola vez en todo el archivo
sort data.txt | uniq -u
Imprime solo las líneas que no están duplicadas y aparecen una sola vez en el archivo `data.txt`.
Eliminar duplicados ignorando un campo específico
sort log.txt | uniq -f 1
Elimina duplicados de un archivo de registro ignorando la información de tiempo (el primer campo) y basándose solo en el contenido restante.