Le moyen le plus rapide de zéro dataframe / colonne dans Python Pandas
Existe-t-il un moyen plus rapide de mettre à zéro une colonne de dataframe pandas que d'itérer dans la dataframe comme ceci (où A, B et C sont les noms de colonne):
while x < Framelength
dg.iloc[x, A] = 0
dg.iloc[x, B] = 0
dg.iloc[x, C] = 0
x+=1
Je suis d'accord avec la remise à zéro de l'ensemble de la trame de données si cela serait plus rapide
Réponses
Vérifier avec
cols=[...]
df.loc[:, cols]=0
Vous pouvez mettre à zéro l'ensemble de la trame de données:
df[df.columns] = 0
ou spécifiez une liste (itérative) de colonnes:
cols = list("ABC")
df[cols] = 0
Pour remettre à zéro toutes les lignes d'une colonne en appelant le nom de la colonne, vous pouvez faire quelque chose comme:
df["A"] = 0
df["B"] = 0
Si vous voulez mettre à zéro le DataFrame entier, je pense que quelque chose comme ça devrait être assez efficace:
for c in df:
df[c].values[:] = 0
J'utiliserais une approche simple en énonçant une condition et en attribuant une valeur que vous voulez
import pandas as pd
df = pd.DataFrame({'A': [1,2,3,4,5], 'B': [34,63,2,5,0]})
# Approach
df.columns = [0 for _ in df.columns]
df[df!=0] = 0
# Result
0 0
0 0 0
1 0 0
2 0 0
3 0 0
4 0 0
Essayez ceci, en utilisant l' values
attribut d'un dataframe et np.array.fill
:
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randint(0,100,(5,5)), index=[*'abcde'], columns=[*'ABCDE'])
print(df)
# A B C D E
# a 94 96 76 99 34
# b 88 63 17 51 46
# c 92 64 32 12 23
# d 88 89 43 34 50
# e 93 37 70 27 40
df.values.fill(0)
print(df)
# A B C D E
# a 0 0 0 0 0
# b 0 0 0 0 0
# c 0 0 0 0 0
# d 0 0 0 0 0
# e 0 0 0 0 0