Awk - Coincidencia de valores entre dos archivos
Tengo dos archivos que estoy tratando de comparar y creo un archivo final.txt con datos que existen de ambos archivos.
Archivo1 - columna 1 y Archivo2 - columnas 2 contienen el valor que necesito para hacer coincidir los dos archivos.
Entonces, esencialmente, estoy tratando de -> tomar column1 de File1, si hay una coincidencia en column2 de file2, luego escribir File1Column1, File1Column2 y File2Column1 en un nuevo archivo llamado final.txt.
EJEMPLO
Archivo 1
1000,Brian
1010,Jason
400,Nick
Archivo 2
3044 "1000"
4466 "400"
1206 "1010"
archivo de salida para parecerse a
1000,Brian,3044
1010,Jason,1206
400,Nick,4466
mi código de prueba no muestra ningún resultado
awk -F"[,]" 'NR==FNR{a[$1]=$1","$2;next} ($2 in a){print a[$2]","$1}' file1.txt file2.txt
Creo que debería poder hacer esto con awk, pero por alguna razón estoy realmente luchando con este. Cualquier ayuda será muy apreciada.
Gracias
Respuestas
¿Podría intentar seguir, escribir y probar con las muestras que se muestran en GNU awk
?
awk '
FNR==NR{
gsub(/"/,"",$2) arr[$2]=$1 next } FNR==1{ FS="," OFS="," $0=$0 } ($1 in arr){
print $0,arr[$1]
}
' Input_file2 Input_file1
Explicación: Añadiendo una explicación detallada de lo anterior.
awk ' ##Starting awk program from here.
FNR==NR{ ##Checking condition FNR==NR which will be TRUE when Input_file1 is being read.
gsub(/"/,"",$2) ##globally substituting " in 2nd field with NULL. arr[$2]=$1 ##Creating array arr with index of 2nd field and value of 1st field. next ##next will skip all further statements from here. } FNR==1{ ##Checking condition if this is first line of Input_file1. FS="," ##Setting FS as comma here. OFS="," ##Setting OFS as comma here. $0=$0 ##Reassigning current line to itself so that field separator values will be implemented to current line. } ($1 in arr){ ##Checking condition if 1st field is present in arr then do following.
print $0,arr[$1] ##Printing current line and value of array arr.
}
' file2 file1 ##Mentioning Input_file names here.
No incluyó ninguna línea que no coincida entre los 2 archivos de entrada en su entrada / salida de muestra, por lo que esto puede o no hacer lo que desea para esos casos:
$ cat tst.awk BEGIN { FS="[[:space:]\",]+"; OFS="," } NR==FNR { map[$2] = $1 next } { print $0, map[$1] }
$ awk -f tst.awk file2 file1
1000,Brian,3044
1010,Jason,1206
400,Nick,4466