Python Pandas - Yineleme

Pandas nesneleri üzerindeki temel yinelemenin davranışı türe bağlıdır. Bir Seri üzerinde yinelendiğinde, dizi benzeri olarak kabul edilir ve temel yineleme değerleri üretir. DataFrame ve Panel gibi diğer veri yapıları,dict-like üzerinde yineleme geleneği keys nesnelerin.

Kısacası, temel yineleme ( i nesnede) üretir -

  • Series - değerler

  • DataFrame - sütun etiketleri

  • Panel - ürün etiketleri

Bir DataFrame'i Yineleme

Bir DataFrame'i yinelemek sütun adları verir. Aynısını anlamak için aşağıdaki örneği ele alalım.

import pandas as pd
import numpy as np
 
N=20
df = pd.DataFrame({
   'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
   'x': np.linspace(0,stop=N-1,num=N),
   'y': np.random.rand(N),
   'C': np.random.choice(['Low','Medium','High'],N).tolist(),
   'D': np.random.normal(100, 10, size=(N)).tolist()
   })

for col in df:
   print col

Onun output aşağıdaki gibidir -

A
C
D
x
y

DataFrame'in satırları üzerinde yineleme yapmak için aşağıdaki işlevleri kullanabiliriz -

  • iteritems() - (anahtar, değer) çiftleri üzerinde yinelemek için

  • iterrows() - satırlar üzerinde (dizin, seri) çiftleri olarak yineleme

  • itertuples() - adlandırılmış çiftler olarak satırlar üzerinde yineleme

iteritems ()

Anahtar olarak her sütunun üzerinde, anahtar olarak etiketle değer çifti ve bir Seri nesnesi olarak sütun değeriyle birlikte yineler.

import pandas as pd
import numpy as np
 
df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3'])
for key,value in df.iteritems():
   print key,value

Onun output aşağıdaki gibidir -

col1 0    0.802390
1    0.324060
2    0.256811
3    0.839186
Name: col1, dtype: float64

col2 0    1.624313
1   -1.033582
2    1.796663
3    1.856277
Name: col2, dtype: float64

col3 0   -0.022142
1   -0.230820
2    1.160691
3   -0.830279
Name: col3, dtype: float64

Her sütunun bir Serideki anahtar / değer çifti olarak ayrı ayrı yinelendiğine dikkat edin.

yinelemeler ()

iterrows (), her bir satırdaki verileri içeren bir seri ile birlikte her dizin değerini veren yineleyiciyi döndürür.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row_index,row in df.iterrows():
   print row_index,row

Onun output aşağıdaki gibidir -

0  col1    1.529759
   col2    0.762811
   col3   -0.634691
Name: 0, dtype: float64

1  col1   -0.944087
   col2    1.420919
   col3   -0.507895
Name: 1, dtype: float64
 
2  col1   -0.077287
   col2   -0.858556
   col3   -0.663385
Name: 2, dtype: float64
3  col1    -1.638578
   col2     0.059866
   col3     0.493482
Name: 3, dtype: float64

Note - Çünkü iterrows()satırlar üzerinde yineleyin, satır boyunca veri türünü korumaz. 0,1,2 satır indeksleridir ve col1, col2, col3 sütun indeksleridir.

yinelemeler ()

itertuples () yöntemi, DataFrame'deki her satır için adlandırılmış bir demet oluşturan bir yineleyici döndürür. Demetin ilk öğesi, satırın karşılık gelen indeks değeri olurken, kalan değerler satır değerleridir.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row in df.itertuples():
    print row

Onun output aşağıdaki gibidir -

Pandas(Index=0, col1=1.5297586201375899, col2=0.76281127433814944, col3=-
0.6346908238310438)

Pandas(Index=1, col1=-0.94408735763808649, col2=1.4209186418359423, col3=-
0.50789517967096232)

Pandas(Index=2, col1=-0.07728664756791935, col2=-0.85855574139699076, col3=-
0.6633852507207626)

Pandas(Index=3, col1=0.65734942534106289, col2=-0.95057710432604969,
col3=0.80344487462316527)

Note- Yineleme sırasında herhangi bir nesneyi değiştirmeye çalışmayın. Yineleme, okumak içindir ve yineleyici, orijinal nesnenin bir kopyasını (bir görünüm) döndürür, böylece değişiklikler orijinal nesneye yansıtılmaz.

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])

for index, row in df.iterrows():
   row['a'] = 10
print df

Onun output aşağıdaki gibidir -

col1       col2       col3
0  -1.739815   0.735595  -0.295589
1   0.635485   0.106803   1.527922
2  -0.939064   0.547095   0.038585
3  -1.016509  -0.116580  -0.523158

Gözlemleyin, hiçbir değişiklik yansıtılmadı.