पायथन पंडों - गर्भाधान
पंडों वस्तुओं पर मूल पुनरावृत्ति का व्यवहार प्रकार पर निर्भर करता है। जब एक श्रृंखला पर पुनरावृत्ति होती है, तो इसे सरणी-जैसा माना जाता है, और बुनियादी पुनरावृत्ति मूल्यों का निर्माण करता है। अन्य डेटा संरचनाएं, जैसे कि डेटाफ़्रेम और पैनल, का पालन करेंdict-like इस पर चलने का सम्मेलन keys वस्तुओं का।
संक्षेप में, मूल पुनरावृत्ति (के लिए) i वस्तु में) उत्पादन -
Series - मान
DataFrame - कॉलम लेबल
Panel - आइटम लेबल
एक DataFrame Iterating
एक DataFrame Iterating कॉलम नाम देता है। आइए इसे समझने के लिए निम्नलिखित उदाहरण पर विचार करें।
import pandas as pd
import numpy as np
N=20
df = pd.DataFrame({
'A': pd.date_range(start='2016-01-01',periods=N,freq='D'),
'x': np.linspace(0,stop=N-1,num=N),
'y': np.random.rand(N),
'C': np.random.choice(['Low','Medium','High'],N).tolist(),
'D': np.random.normal(100, 10, size=(N)).tolist()
})
for col in df:
print col
आईटी इस output इस प्रकार है -
A
C
D
x
y
DataFrame की पंक्तियों पर पुनरावृति करने के लिए, हम निम्नलिखित कार्यों का उपयोग कर सकते हैं -
iteritems() - कुंजी (कुंजी, मूल्य) जोड़े पर पुनरावृति करने के लिए
iterrows() - (अनुक्रमणिका, श्रृंखला) जोड़े के रूप में पंक्तियों पर पुनरावृति
itertuples() - पंक्तियों पर ittuples के रूप में iterate
iteritems ()
प्रत्येक कॉलम को कुंजी के रूप में, वैल्यू पेयर को लेबल के साथ कुंजी और कॉलम वैल्यू के रूप में एक सीरीज़ ऑब्जेक्ट के रूप में बदल देता है।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns=['col1','col2','col3'])
for key,value in df.iteritems():
print key,value
आईटी इस output इस प्रकार है -
col1 0 0.802390
1 0.324060
2 0.256811
3 0.839186
Name: col1, dtype: float64
col2 0 1.624313
1 -1.033582
2 1.796663
3 1.856277
Name: col2, dtype: float64
col3 0 -0.022142
1 -0.230820
2 1.160691
3 -0.830279
Name: col3, dtype: float64
ध्यान से देखें, प्रत्येक स्तंभ एक श्रृंखला में एक कुंजी-मूल्य जोड़ी के रूप में अलग से प्रसारित होता है।
iterrows ()
iterrows () प्रत्येक अनुक्रमणिका मान के साथ-साथ प्रत्येक पंक्ति में डेटा युक्त एक श्रृंखला उत्पन्न करने वाले पुनरावृत्तिकर्ता को लौटाता है।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row_index,row in df.iterrows():
print row_index,row
आईटी इस output इस प्रकार है -
0 col1 1.529759
col2 0.762811
col3 -0.634691
Name: 0, dtype: float64
1 col1 -0.944087
col2 1.420919
col3 -0.507895
Name: 1, dtype: float64
2 col1 -0.077287
col2 -0.858556
col3 -0.663385
Name: 2, dtype: float64
3 col1 -1.638578
col2 0.059866
col3 0.493482
Name: 3, dtype: float64
Note - क्योंकि iterrows()पंक्तियों पर पुनरावृति, यह पंक्ति में डेटा प्रकार को संरक्षित नहीं करता है। 0,1,2 पंक्ति सूचक और col1, col2, col3 स्तंभ सूचक हैं।
itertuples ()
itertuples () विधि DataFrame में प्रत्येक पंक्ति के लिए एक नामित टपल की सहायता से एक इट्रेटर लौटाएगा। टपल का पहला तत्व पंक्ति का संगत सूचकांक मान होगा, जबकि शेष मान पंक्ति मान हैं।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for row in df.itertuples():
print row
आईटी इस output इस प्रकार है -
Pandas(Index=0, col1=1.5297586201375899, col2=0.76281127433814944, col3=-
0.6346908238310438)
Pandas(Index=1, col1=-0.94408735763808649, col2=1.4209186418359423, col3=-
0.50789517967096232)
Pandas(Index=2, col1=-0.07728664756791935, col2=-0.85855574139699076, col3=-
0.6633852507207626)
Pandas(Index=3, col1=0.65734942534106289, col2=-0.95057710432604969,
col3=0.80344487462316527)
Note- पुनरावृति करते समय किसी भी वस्तु को संशोधित करने का प्रयास न करें। Iterating पढ़ने के लिए है और इट्रेटर मूल ऑब्जेक्ट (एक दृश्य) की एक प्रति लौटाता है, इस प्रकार परिवर्तन मूल वस्तु पर प्रतिबिंबित नहीं करेगा।
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(4,3),columns = ['col1','col2','col3'])
for index, row in df.iterrows():
row['a'] = 10
print df
आईटी इस output इस प्रकार है -
col1 col2 col3
0 -1.739815 0.735595 -0.295589
1 0.635485 0.106803 1.527922
2 -0.939064 0.547095 0.038585
3 -1.016509 -0.116580 -0.523158
निरीक्षण करें, कोई परिवर्तन प्रतिबिंबित नहीं हुआ।