Python Pandas - Yineleme
Pandas nesneleri üzerindeki temel yinelemenin davranışı türe bağlıdır. Bir Seri üzerinde yinelendiğinde, dizi benzeri olarak kabul edilir ve temel yineleme değerleri üretir. DataFrame ve Panel gibi diğer veri yapıları,dict-like üzerinde yineleme geleneği keys nesnelerin.
Kısacası, temel yineleme ( i nesnede) üretir -
Series - değerler
DataFrame - sütun etiketleri
Panel - ürün etiketleri
Bir DataFrame'i Yineleme
Bir DataFrame'i yinelemek sütun adları verir. Aynısını anlamak için aşağıdaki örneği ele alalım.
import pandas as pd
import numpy as np
N=20
df = pd.DataFrame({
'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
'x': np.linspace(0,stop=N-1,num=N),
'y': np.random.rand(N),
'C': np.random.choice(['Low','Medium','High'],N).tolist(),
'D': np.random.normal(100, 10, size=(N)).tolist()
})
for col in df:
print col
Onun output aşağıdaki gibidir -
A
C
D
x
y
DataFrame'in satırları üzerinde yineleme yapmak için aşağıdaki işlevleri kullanabiliriz -
iteritems() - (anahtar, değer) çiftleri üzerinde yinelemek için
iterrows() - satırlar üzerinde (dizin, seri) çiftleri olarak yineleme
itertuples() - adlandırılmış çiftler olarak satırlar üzerinde yineleme
iteritems ()
Anahtar olarak her sütunun üzerinde, anahtar olarak etiketle değer çifti ve bir Seri nesnesi olarak sütun değeriyle birlikte yineler.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3'])
for key,value in df.iteritems():
print key,value
Onun output aşağıdaki gibidir -
col1 0 0.802390
1 0.324060
2 0.256811
3 0.839186
Name: col1, dtype: float64
col2 0 1.624313
1 -1.033582
2 1.796663
3 1.856277
Name: col2, dtype: float64
col3 0 -0.022142
1 -0.230820
2 1.160691
3 -0.830279
Name: col3, dtype: float64
Her sütunun bir Serideki anahtar / değer çifti olarak ayrı ayrı yinelendiğine dikkat edin.
yinelemeler ()
iterrows (), her bir satırdaki verileri içeren bir seri ile birlikte her dizin değerini veren yineleyiciyi döndürür.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row_index,row in df.iterrows():
print row_index,row
Onun output aşağıdaki gibidir -
0 col1 1.529759
col2 0.762811
col3 -0.634691
Name: 0, dtype: float64
1 col1 -0.944087
col2 1.420919
col3 -0.507895
Name: 1, dtype: float64
2 col1 -0.077287
col2 -0.858556
col3 -0.663385
Name: 2, dtype: float64
3 col1 -1.638578
col2 0.059866
col3 0.493482
Name: 3, dtype: float64
Note - Çünkü iterrows()satırlar üzerinde yineleyin, satır boyunca veri türünü korumaz. 0,1,2 satır indeksleridir ve col1, col2, col3 sütun indeksleridir.
yinelemeler ()
itertuples () yöntemi, DataFrame'deki her satır için adlandırılmış bir demet oluşturan bir yineleyici döndürür. Demetin ilk öğesi, satırın karşılık gelen indeks değeri olurken, kalan değerler satır değerleridir.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row in df.itertuples():
print row
Onun output aşağıdaki gibidir -
Pandas(Index=0, col1=1.5297586201375899, col2=0.76281127433814944, col3=-
0.6346908238310438)
Pandas(Index=1, col1=-0.94408735763808649, col2=1.4209186418359423, col3=-
0.50789517967096232)
Pandas(Index=2, col1=-0.07728664756791935, col2=-0.85855574139699076, col3=-
0.6633852507207626)
Pandas(Index=3, col1=0.65734942534106289, col2=-0.95057710432604969,
col3=0.80344487462316527)
Note- Yineleme sırasında herhangi bir nesneyi değiştirmeye çalışmayın. Yineleme, okumak içindir ve yineleyici, orijinal nesnenin bir kopyasını (bir görünüm) döndürür, böylece değişiklikler orijinal nesneye yansıtılmaz.
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for index, row in df.iterrows():
row['a'] = 10
print df
Onun output aşağıdaki gibidir -
col1 col2 col3
0 -1.739815 0.735595 -0.295589
1 0.635485 0.106803 1.527922
2 -0.939064 0.547095 0.038585
3 -1.016509 -0.116580 -0.523158
Gözlemleyin, hiçbir değişiklik yansıtılmadı.