Resumen
join compara campos específicos de dos archivos y combina las líneas coincidentes. Este comando funciona correctamente solo si los archivos de entrada están ordenados según el campo común. Usarlo con archivos no ordenados puede producir resultados inesperados.
Características principales
- Fusión basada en campos comunes de dos archivos
- Se requiere ordenación de archivos de entrada
- Control del formato de salida con varias opciones
- Útil para la integración de datos y la generación de informes
Opciones principales
El comando join permite un control detallado sobre los criterios de fusión, el formato de salida y el manejo de líneas no coincidentes a través de varias opciones.
Especificación de campos y delimitadores
Control de salida
Comando generado:
Combina los comandos.
Descripción:
`join` Ejecutando el comando.
Combina las opciones anteriores para ejecutar virtualmente los comandos junto con la IA.
Ejemplos de uso
Aprenda a fusionar datos de dos archivos de manera efectiva a través de varios ejemplos de uso del comando join.
Fusión básica
echo "1 apple\n2 banana" > file1.txt && echo "1 red\n2 yellow" > file2.txt && join file1.txt file2.txt
Fusiona basándose en el primer campo de ambos archivos. (Crear archivos y luego ejecutar)
Fusión de campo específico
echo "apple 1\nbanana 2" > file3.txt && echo "red 1\nyellow 2" > file4.txt && join -j 2 file3.txt file4.txt
Fusiona basándose en el segundo campo de ambos archivos. (Crear archivos y luego ejecutar)
Uso de delimitador de tabulación
echo -e "id\tname\n1\tAlice\n2\tBob" > users.tsv && echo -e "id\tcity\n1\tSeoul\n3\tParis" > cities.tsv && join -t $'\t' users.tsv cities.tsv
Fusiona archivos delimitados por tabulación. (Crear archivos y luego ejecutar)
Incluir líneas no coincidentes
echo "1 apple\n2 banana\n3 orange" > file5.txt && echo "1 red\n2 yellow" > file6.txt && join -a 1 file5.txt file6.txt
Incluye en la salida las líneas que solo existen en el primer archivo (file5.txt). (Crear archivos y luego ejecutar)
Mostrar solo campos específicos
echo "1 apple\n2 banana" > file7.txt && echo "1 red\n2 yellow" > file8.txt && join -o 1.1,1.2,2.2 file7.txt file8.txt
Muestra solo el primer y segundo campo del primer archivo y el segundo campo del segundo archivo. (Crear archivos y luego ejecutar)
Consejos y precauciones
Consejos útiles y puntos a tener en cuenta al usar el comando join.
Consejos importantes
- **Ordenación de archivos de entrada**: El comando join solo funciona correctamente si los archivos de entrada están ordenados según el campo de unión. Es esencial ordenarlos previamente usando el comando `sort`. Ej: `sort file1.txt > sorted_file1.txt`
- **Delimitador de campos**: El delimitador predeterminado es el espacio (espacio en blanco, tabulación). Si usa un delimitador diferente, use la opción `-t`. Por ejemplo, para archivos CSV, use `-t ','`.
- **Control del formato de salida**: Puede controlar con precisión el orden y la inclusión de los campos que se mostrarán utilizando la opción `-o`. Se especifica en el formato `NUMERO_ARCHIVO.NUMERO_CAMPO` (ej: `1.2` es el segundo campo del primer archivo).
- **Manejo de líneas no coincidentes**: Puede incluir líneas no coincidentes en la salida o mostrar solo las líneas no coincidentes utilizando las opciones `-a` o `-v`.