Combinar archivos que comiencen con los mismos caracteres usando ArcPy
Aug 20 2020
Estoy tratando de fusionar archivos que comienzan con los mismos 2 caracteres que se muestran a continuación;
- 11111 - fusionar (nombre de salida: 11.shp)
- 11112 - fusionar (nombre de salida: 11.shp)
- 11113 - fusionar (nombre de salida: 11.shp)
- 22112 - fusionar (nombre de salida: 22.shp)
- 22153 - fusionar (nombre de salida: 22.shp)
Pero el resultado de mi script de Python se fusiona si "11" está incluido en los nombres de archivo (como 4)). Solo quiero 11 ***. Shp (1) ~ 3)) pero un script fusiona 11 .shp (fusiona 1 ~ 4 como 11.shp)
================================================ ======================
import sys, os, arcpy, fnmatch
reload(sys)
arcpy.env.workspace = r"F:\a"
workspace = arcpy.env.workspace
outdir = r"F:\b"
List = []
for dirpath, dirnames, filenames in os.walk(workspace, topdown=True):
for filename in filenames:
List.append(os.path.join(dirpath, filename))
break
patterns = set([os.path.basename(fl)[:2] for fl in List])
for pattern in patterns:
group = [fl for fl in List if fnmatch.fnmatchcase(fl, '*' + pattern + '*.shp')]
output = os.path.join(outdir, pattern)
arcpy.Merge_management(group, output)
================================================ ======================
¿Cómo puedo arreglarlo?
Respuestas
2 BERA Aug 20 2020 at 14:58
Me gustan las colecciones.defaultdict (lista) :
... para agrupar una secuencia de pares clave-valor en un diccionario de listas
Ejemplo:
import arcpy, os
from collections import defaultdict as dd
folder = r'C:\GIS\data\testdata\merge'
out_folder = r'C:\GIS\data\testdata\outfolder'
d = dd(list)
for item in os.listdir(folder):
if os.path.isfile(os.path.join(folder,item)) and file.endswith('.shp'):
d[item[:2]].append(os.path.join(folder, item))
#Execute code above then print(d) to make sure its ok before merging
for group, mergelist in d.items():
#print(group, mergelist)
arcpy.Merge_management(inputs=mergelist, output=os.path.join(out_folder, 'Merge_{}.shp'.format(group)))
Si también desea buscar subdirectorios, use os.walk como lo intentó, por ejemplo:
import os
from collections import defaultdict as dd
folder_main = r'C:\GIS\data\testdata'
d = dd(list)
for root, folder, files in os.walk(folder_main):
for file in files:
if os.path.isfile(os.path.join(root, file)) and file.endswith('.shp'):
print(file)
d[file[:2]].append(os.path.join(root, file))