पाइथन पंडों - कैविट्स और गोचक्स
कैविट्स का अर्थ है चेतावनी और गोत्र का अर्थ है एक अनदेखी समस्या।
पंडों के साथ अगर / सत्य कथन का उपयोग करना
जब आप किसी चीज़ को किसी में बदलने की कोशिश करते हैं, तो पंडास एक त्रुटि को उठाने के सुस्पष्ट सम्मेलन का अनुसरण करता है bool। ए में ऐसा होता हैif या when बुलियन संचालन का उपयोग करना, और, or, या not। यह स्पष्ट नहीं है कि परिणाम क्या होना चाहिए। क्या यह सच होना चाहिए क्योंकि यह शून्य-गति नहीं है? गलत क्योंकि गलत मूल्य हैं? यह स्पष्ट नहीं है, इसलिए इसके बजाय, पंडों ने उठायाValueError -
import pandas as pd
if pd.Series([False, True, False]):
print 'I am True'
आईटी इस output इस प्रकार है -
ValueError: The truth value of a Series is ambiguous.
Use a.empty, a.bool() a.item(),a.any() or a.all().
में ifहालत, यह स्पष्ट नहीं है कि इसके साथ क्या करना है। त्रुटि एक का उपयोग करने के लिए सुझाव है कि क्याNone या any of those।
import pandas as pd
if pd.Series([False, True, False]).any():
print("I am any")
आईटी इस output इस प्रकार है -
I am any
बुलियन संदर्भ में एकल-तत्व पांडा वस्तुओं का मूल्यांकन करने के लिए, विधि का उपयोग करें .bool() -
import pandas as pd
print pd.Series([True]).bool()
आईटी इस output इस प्रकार है -
True
बिटवाइज़ बुलियन
बिटवाइज़ बुलियन ऑपरेटर जैसे == और != एक बूलियन श्रृंखला लौटाएगा, जो लगभग हमेशा वैसे भी आवश्यक है।
import pandas as pd
s = pd.Series(range(5))
print s==4
आईटी इस output इस प्रकार है -
0 False
1 False
2 False
3 False
4 True
dtype: bool
आइसिन ऑपरेशन
यह एक बूलियन श्रृंखला देता है जिसमें दिखाया गया है कि श्रृंखला में प्रत्येक तत्व मूल्यों के पारित अनुक्रम में निहित है या नहीं।
import pandas as pd
s = pd.Series(list('abc'))
s = s.isin(['a', 'c', 'e'])
print s
आईटी इस output इस प्रकार है -
0 True
1 False
2 True
dtype: bool
रिंडेक्सिंग बनाम ix गोत्चा
कई उपयोगकर्ता स्वयं का उपयोग कर पाएंगे ix indexing capabilities पंडों वस्तु से डेटा का चयन करने के लिए एक संक्षिप्त साधन के रूप में -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(6, 4), columns=['one', 'two', 'three',
'four'],index=list('abcdef'))
print df
print df.ix[['b', 'c', 'e']]
आईटी इस output इस प्रकार है -
one two three four
a -1.582025 1.335773 0.961417 -1.272084
b 1.461512 0.111372 -0.072225 0.553058
c -1.240671 0.762185 1.511936 -0.630920
d -2.380648 -0.029981 0.196489 0.531714
e 1.846746 0.148149 0.275398 -0.244559
f -1.842662 -0.933195 2.303949 0.677641
one two three four
b 1.461512 0.111372 -0.072225 0.553058
c -1.240671 0.762185 1.511936 -0.630920
e 1.846746 0.148149 0.275398 -0.244559
यह निश्चित रूप से, इस मामले में पूरी तरह से उपयोग करने के लिए बराबर है reindex विधि -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(6, 4), columns=['one', 'two', 'three',
'four'],index=list('abcdef'))
print df
print df.reindex(['b', 'c', 'e'])
आईटी इस output इस प्रकार है -
one two three four
a 1.639081 1.369838 0.261287 -1.662003
b -0.173359 0.242447 -0.494384 0.346882
c -0.106411 0.623568 0.282401 -0.916361
d -1.078791 -0.612607 -0.897289 -1.146893
e 0.465215 1.552873 -1.841959 0.329404
f 0.966022 -0.190077 1.324247 0.678064
one two three four
b -0.173359 0.242447 -0.494384 0.346882
c -0.106411 0.623568 0.282401 -0.916361
e 0.465215 1.552873 -1.841959 0.329404
कुछ लोग यह निष्कर्ष निकाल सकते हैं ix तथा reindexइस पर आधारित 100% बराबर हैं। पूर्णांक अनुक्रमण के मामले को छोड़कर यह सही है। उदाहरण के लिए, उपरोक्त ऑपरेशन को वैकल्पिक रूप से व्यक्त किया जा सकता है -
import pandas as pd
import numpy as np
df = pd.DataFrame(np.random.randn(6, 4), columns=['one', 'two', 'three',
'four'],index=list('abcdef'))
print df
print df.ix[[1, 2, 4]]
print df.reindex([1, 2, 4])
आईटी इस output इस प्रकार है -
one two three four
a -1.015695 -0.553847 1.106235 -0.784460
b -0.527398 -0.518198 -0.710546 -0.512036
c -0.842803 -1.050374 0.787146 0.205147
d -1.238016 -0.749554 -0.547470 -0.029045
e -0.056788 1.063999 -0.767220 0.212476
f 1.139714 0.036159 0.201912 0.710119
one two three four
b -0.527398 -0.518198 -0.710546 -0.512036
c -0.842803 -1.050374 0.787146 0.205147
e -0.056788 1.063999 -0.767220 0.212476
one two three four
1 NaN NaN NaN NaN
2 NaN NaN NaN NaN
4 NaN NaN NaN NaN
यह याद रखना महत्वपूर्ण है reindex is strict label indexing only। यह पैथोलॉजिकल मामलों में कुछ संभावित आश्चर्यजनक परिणाम पैदा कर सकता है जहां एक सूचकांक होता है, कहते हैं, पूर्णांक और तार दोनों।