Awk - Coincidencia de valores entre dos archivos

Dec 28 2020

Tengo dos archivos que estoy tratando de comparar y creo un archivo final.txt con datos que existen de ambos archivos.

Archivo1 - columna 1 y Archivo2 - columnas 2 contienen el valor que necesito para hacer coincidir los dos archivos.

Entonces, esencialmente, estoy tratando de -> tomar column1 de File1, si hay una coincidencia en column2 de file2, luego escribir File1Column1, File1Column2 y File2Column1 en un nuevo archivo llamado final.txt.

EJEMPLO

Archivo 1

1000,Brian
1010,Jason
400,Nick

Archivo 2

3044 "1000"
4466 "400"
1206 "1010"

archivo de salida para parecerse a

1000,Brian,3044
1010,Jason,1206
400,Nick,4466

mi código de prueba no muestra ningún resultado

awk -F"[,]" 'NR==FNR{a[$1]=$1","$2;next} ($2 in a){print a[$2]","$1}' file1.txt file2.txt

Creo que debería poder hacer esto con awk, pero por alguna razón estoy realmente luchando con este. Cualquier ayuda será muy apreciada.

Gracias

Respuestas

2 RavinderSingh13 Dec 28 2020 at 00:58

¿Podría intentar seguir, escribir y probar con las muestras que se muestran en GNU awk?

awk '
FNR==NR{
  gsub(/"/,"",$2) arr[$2]=$1 next } FNR==1{ FS="," OFS="," $0=$0 } ($1 in arr){
  print $0,arr[$1]
}
'  Input_file2  Input_file1

Explicación: Añadiendo una explicación detallada de lo anterior.

awk '                ##Starting awk program from here.
FNR==NR{             ##Checking condition FNR==NR which will be TRUE when Input_file1 is being read.
  gsub(/"/,"",$2) ##globally substituting " in 2nd field with NULL. arr[$2]=$1 ##Creating array arr with index of 2nd field and value of 1st field. next ##next will skip all further statements from here. } FNR==1{ ##Checking condition if this is first line of Input_file1. FS="," ##Setting FS as comma here. OFS="," ##Setting OFS as comma here. $0=$0 ##Reassigning current line to itself so that field separator values will be implemented to current line. } ($1 in arr){         ##Checking condition if 1st field is present in arr then do following.
  print $0,arr[$1]   ##Printing current line and value of array arr.
}
' file2 file1        ##Mentioning Input_file names here.
EdMorton Dec 28 2020 at 05:09

No incluyó ninguna línea que no coincida entre los 2 archivos de entrada en su entrada / salida de muestra, por lo que esto puede o no hacer lo que desea para esos casos:

$ cat tst.awk BEGIN { FS="[[:space:]\",]+"; OFS="," } NR==FNR { map[$2] = $1 next } { print $0, map[$1] }

$ awk -f tst.awk file2 file1
1000,Brian,3044
1010,Jason,1206
400,Nick,4466