पाइथन पंडों - कैविट्स और गोचक्स

कैविट्स का अर्थ है चेतावनी और गोत्र का अर्थ है एक अनदेखी समस्या।

पंडों के साथ अगर / सत्य कथन का उपयोग करना

जब आप किसी चीज़ को किसी में बदलने की कोशिश करते हैं, तो पंडास एक त्रुटि को उठाने के सुस्पष्ट सम्मेलन का अनुसरण करता है bool। ए में ऐसा होता हैif या when बुलियन संचालन का उपयोग करना, और, or, या not। यह स्पष्ट नहीं है कि परिणाम क्या होना चाहिए। क्या यह सच होना चाहिए क्योंकि यह शून्य-गति नहीं है? गलत क्योंकि गलत मूल्य हैं? यह स्पष्ट नहीं है, इसलिए इसके बजाय, पंडों ने उठायाValueError -

import pandas as pd

if pd.Series([False, True, False]):
   print 'I am True'

आईटी इस output इस प्रकार है -

ValueError: The truth value of a Series is ambiguous. 
Use a.empty, a.bool() a.item(),a.any() or a.all().

में ifहालत, यह स्पष्ट नहीं है कि इसके साथ क्या करना है। त्रुटि एक का उपयोग करने के लिए सुझाव है कि क्याNone या any of those

import pandas as pd

if pd.Series([False, True, False]).any():
   print("I am any")

आईटी इस output इस प्रकार है -

I am any

बुलियन संदर्भ में एकल-तत्व पांडा वस्तुओं का मूल्यांकन करने के लिए, विधि का उपयोग करें .bool() -

import pandas as pd

print pd.Series([True]).bool()

आईटी इस output इस प्रकार है -

True

बिटवाइज़ बुलियन

बिटवाइज़ बुलियन ऑपरेटर जैसे == और != एक बूलियन श्रृंखला लौटाएगा, जो लगभग हमेशा वैसे भी आवश्यक है।

import pandas as pd

s = pd.Series(range(5))
print s==4

आईटी इस output इस प्रकार है -

0 False
1 False
2 False
3 False
4 True
dtype: bool

आइसिन ऑपरेशन

यह एक बूलियन श्रृंखला देता है जिसमें दिखाया गया है कि श्रृंखला में प्रत्येक तत्व मूल्यों के पारित अनुक्रम में निहित है या नहीं।

import pandas as pd

s = pd.Series(list('abc'))
s = s.isin(['a', 'c', 'e'])
print s

आईटी इस output इस प्रकार है -

0 True
1 False
2 True
dtype: bool

रिंडेक्सिंग बनाम ix गोत्चा

कई उपयोगकर्ता स्वयं का उपयोग कर पाएंगे ix indexing capabilities पंडों वस्तु से डेटा का चयन करने के लिए एक संक्षिप्त साधन के रूप में -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(6, 4), columns=['one', 'two', 'three',
'four'],index=list('abcdef'))

print df
print df.ix[['b', 'c', 'e']]

आईटी इस output इस प्रकार है -

one        two      three       four
a   -1.582025   1.335773   0.961417  -1.272084
b    1.461512   0.111372  -0.072225   0.553058
c   -1.240671   0.762185   1.511936  -0.630920
d   -2.380648  -0.029981   0.196489   0.531714
e    1.846746   0.148149   0.275398  -0.244559
f   -1.842662  -0.933195   2.303949   0.677641

          one        two      three       four
b    1.461512   0.111372  -0.072225   0.553058
c   -1.240671   0.762185   1.511936  -0.630920
e    1.846746   0.148149   0.275398  -0.244559

यह निश्चित रूप से, इस मामले में पूरी तरह से उपयोग करने के लिए बराबर है reindex विधि -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(6, 4), columns=['one', 'two', 'three',
'four'],index=list('abcdef'))

print df
print df.reindex(['b', 'c', 'e'])

आईटी इस output इस प्रकार है -

one        two      three       four
a    1.639081   1.369838   0.261287  -1.662003
b   -0.173359   0.242447  -0.494384   0.346882
c   -0.106411   0.623568   0.282401  -0.916361
d   -1.078791  -0.612607  -0.897289  -1.146893
e    0.465215   1.552873  -1.841959   0.329404
f    0.966022  -0.190077   1.324247   0.678064

          one        two      three       four
b   -0.173359   0.242447  -0.494384   0.346882
c   -0.106411   0.623568   0.282401  -0.916361
e    0.465215   1.552873  -1.841959   0.329404

कुछ लोग यह निष्कर्ष निकाल सकते हैं ix तथा reindexइस पर आधारित 100% बराबर हैं। पूर्णांक अनुक्रमण के मामले को छोड़कर यह सही है। उदाहरण के लिए, उपरोक्त ऑपरेशन को वैकल्पिक रूप से व्यक्त किया जा सकता है -

import pandas as pd
import numpy as np

df = pd.DataFrame(np.random.randn(6, 4), columns=['one', 'two', 'three',
'four'],index=list('abcdef'))

print df
print df.ix[[1, 2, 4]]
print df.reindex([1, 2, 4])

आईटी इस output इस प्रकार है -

one        two      three       four
a   -1.015695  -0.553847   1.106235  -0.784460
b   -0.527398  -0.518198  -0.710546  -0.512036
c   -0.842803  -1.050374   0.787146   0.205147
d   -1.238016  -0.749554  -0.547470  -0.029045
e   -0.056788   1.063999  -0.767220   0.212476
f    1.139714   0.036159   0.201912   0.710119

          one        two      three       four
b   -0.527398  -0.518198  -0.710546  -0.512036
c   -0.842803  -1.050374   0.787146   0.205147
e   -0.056788   1.063999  -0.767220   0.212476

    one  two  three  four
1   NaN  NaN    NaN   NaN
2   NaN  NaN    NaN   NaN
4   NaN  NaN    NaN   NaN

यह याद रखना महत्वपूर्ण है reindex is strict label indexing only। यह पैथोलॉजिकल मामलों में कुछ संभावित आश्चर्यजनक परिणाम पैदा कर सकता है जहां एक सूचकांक होता है, कहते हैं, पूर्णांक और तार दोनों।