La forma más rápida de cero dataframe / columna en Python Pandas
¿Existe una forma más rápida de poner a cero una columna de marco de datos de pandas que iterar a través del marco de datos de esta manera (donde A, B y C son los nombres de las columnas):
while x < Framelength
dg.iloc[x, A] = 0
dg.iloc[x, B] = 0
dg.iloc[x, C] = 0
x+=1
Estoy de acuerdo con poner a cero todo el marco de datos si eso fuera más rápido
Respuestas
Verifícalo con
cols=[...]
df.loc[:, cols]=0
Puede poner a cero todo el marco de datos:
df[df.columns] = 0
o especificar una lista (iterable) de columnas:
cols = list("ABC")
df[cols] = 0
Para poner a cero todas las filas de una columna llamando al nombre de la columna, puede hacer algo como:
df["A"] = 0
df["B"] = 0
Si desea poner a cero todo el DataFrame, creo que algo como esto debería ser bastante eficiente:
for c in df:
df[c].values[:] = 0
Usaría un enfoque simple al establecer una condición y asignar un valor que desee
import pandas as pd
df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [34,63,2,5,0]})
# Approach
df.columns = [0 for _ in df.columns]
df[df!=0] = 0
# Result
0 0
0 0 0
1 0 0
2 0 0
3 0 0
4 0 0
Prueba esto, usando el values
atributo de un marco de datos y np.array.fill
:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0,100,(5,5)), index=[*'abcde'], columns=[*'ABCDE'])
print(df)
# A B C D E
# a 94 96 76 99 34
# b 88 63 17 51 46
# c 92 64 32 12 23
# d 88 89 43 34 50
# e 93 37 70 27 40
df.values.fill(0)
print(df)
# A B C D E
# a 0 0 0 0 0
# b 0 0 0 0 0
# c 0 0 0 0 0
# d 0 0 0 0 0
# e 0 0 0 0 0