Awk - соответствие значений двух файлов
У меня есть два файла, которые я пытаюсь сравнить, и я создаю файл final.txt с данными, которые существуют из обоих этих файлов.
File1 - столбец 1 и File2 - столбцы 2 содержат значение, которое мне нужно сопоставить между двумя файлами.
По сути, я пытаюсь → взять column1 из File1, если есть совпадение в column2 file2, затем записать File1Column1, File1Column2 и File2Column1 в новый файл с именем final.txt.
ПРИМЕР
Файл 1
1000,Brian
1010,Jason
400,Nick
Файл 2
3044 "1000"
4466 "400"
1206 "1010"
выходной файл, чтобы выглядеть как
1000,Brian,3044
1010,Jason,1206
400,Nick,4466
мой тестовый код не показывает никаких результатов
awk -F"[,]" 'NR==FNR{a[$1]=$1","$2;next} ($2 in a){print a[$2]","$1}' file1.txt file2.txt
Я считаю, что смогу сделать это с помощью awk, но по какой-то причине я действительно борюсь с этим. Любая помощь будет принята с благодарностью.
Спасибо
Ответы
Не могли бы вы попробовать следовать, написано и протестировано с вашими показанными образцами в GNU awk
.
awk '
FNR==NR{
gsub(/"/,"",$2) arr[$2]=$1 next } FNR==1{ FS="," OFS="," $0=$0 } ($1 in arr){
print $0,arr[$1]
}
' Input_file2 Input_file1
Explanation: Добавление подробного объяснения вышеизложенного.
awk ' ##Starting awk program from here.
FNR==NR{ ##Checking condition FNR==NR which will be TRUE when Input_file1 is being read.
gsub(/"/,"",$2) ##globally substituting " in 2nd field with NULL. arr[$2]=$1 ##Creating array arr with index of 2nd field and value of 1st field. next ##next will skip all further statements from here. } FNR==1{ ##Checking condition if this is first line of Input_file1. FS="," ##Setting FS as comma here. OFS="," ##Setting OFS as comma here. $0=$0 ##Reassigning current line to itself so that field separator values will be implemented to current line. } ($1 in arr){ ##Checking condition if 1st field is present in arr then do following.
print $0,arr[$1] ##Printing current line and value of array arr.
}
' file2 file1 ##Mentioning Input_file names here.
Вы не включили какие-либо строки, которые не совпадают между двумя входными файлами в вашем образце ввода / вывода, поэтому это может или не может сделать то, что вы хотите для этих случаев:
$ cat tst.awk BEGIN { FS="[[:space:]\",]+"; OFS="," } NR==FNR { map[$2] = $1 next } { print $0, map[$1] }
$ awk -f tst.awk file2 file1
1000,Brian,3044
1010,Jason,1206
400,Nick,4466