NumPy - डेटा प्रकार
NumPy पायथन की तुलना में संख्यात्मक प्रकार के बहुत अधिक विविधता का समर्थन करता है। निम्न तालिका में विभिन्न स्केल डेटा प्रकारों को परिभाषित किया गया है।
अनु क्रमांक। | डेटा प्रकार और विवरण |
---|---|
1 | bool_ बूलियन (सच या गलत) एक बाइट के रूप में संग्रहीत |
2 | int_ डिफ़ॉल्ट पूर्णांक प्रकार (समान रूप से C लंबा; सामान्य रूप से या तो int64 या int32) |
3 | intc C int की पहचान (सामान्य रूप से int32 या int64) |
4 | intp अनुक्रमणिका के लिए उपयोग किए जाने वाले पूर्णांक (सी ssize_t के रूप में (सामान्य रूप से या तो इंट 32 या int64) |
5 | int8 बाइट -128 (127 से 127) |
6 | int16 पूर्णांक (-32768 से 32767) |
7 | int32 इंटेगर (-2147483648 से 2147483647) |
8 | int64 इंटेगर (-922337203685474780808 to 9223372036854775807) |
9 | uint8 अहस्ताक्षरित पूर्णांक (0 से 255) |
10 | uint16 निरुपित पूर्णांक (0 से 65535) |
1 1 | uint32 निरुपित पूर्णांक (0 से 4294967295) |
12 | uint64 निरुपित पूर्णांक (0 से 18446744073709551615) |
13 | float_ फ्लोट64 के लिए शॉर्टहैंड |
14 | float16 आधा सटीक फ्लोट: साइन बिट, 5 बिट एक्सपेंसर, 10 बिट मंटिसा |
15 | float32 एकल परिशुद्धता फ्लोट: साइन बिट, 8 बिट एक्सपेंसर, 23 बिट्स मंटिसा |
16 | float64 डबल सटीक फ्लोट: साइन बिट, 11 बिट्स घातांक, 52 बिट्स मंटिसा |
17 | complex_ कॉम्पलेक्स128 के लिए शॉर्टहैंड |
18 | complex64 जटिल संख्या, दो 32-बिट फ्लोट्स द्वारा प्रस्तुत (वास्तविक और काल्पनिक घटक) |
19 | complex128 जटिल संख्या, दो 64-बिट फ्लोट्स द्वारा प्रस्तुत (वास्तविक और काल्पनिक घटक) |
NumPy संख्यात्मक प्रकार dtype (डेटा-प्रकार) ऑब्जेक्ट्स के उदाहरण हैं, जिनमें से प्रत्येक में अद्वितीय विशेषताएं हैं। Dtypes np.bool_, np.float32, आदि के रूप में उपलब्ध हैं।
डेटा प्रकार ऑब्जेक्ट (dtype)
एक डेटा प्रकार ऑब्जेक्ट एक सरणी के अनुरूप मेमोरी के निश्चित ब्लॉक की व्याख्या का वर्णन करता है, जो निम्न पहलुओं पर निर्भर करता है -
डेटा का प्रकार (पूर्णांक, फ्लोट या पायथन ऑब्जेक्ट)
डेटा का आकार
बाइट ऑर्डर (छोटा-एंडियन या बड़ा-एंडियन)
संरचित प्रकार के मामले में, फ़ील्ड के नाम, प्रत्येक फ़ील्ड के डेटा प्रकार और प्रत्येक फ़ील्ड द्वारा लिए गए मेमोरी ब्लॉक का हिस्सा।
यदि डेटा प्रकार एक उप-प्रकार है, तो इसका आकार और डेटा प्रकार
बाइट ऑर्डर को डेटा टाइप के लिए '<' या '>' प्रीफ़िक्स करके तय किया जाता है। '<' का अर्थ है कि एन्कोडिंग छोटा-सा एंडियन है (कम से कम महत्वपूर्ण को सबसे छोटे पते में संग्रहीत किया जाता है)। '>' का अर्थ है कि एन्कोडिंग बड़ा-एंडियन (सबसे महत्वपूर्ण बाइट सबसे छोटे पते में संग्रहीत है)।
निम्नलिखित सिंटैक्स का उपयोग करके एक dtype ऑब्जेक्ट का निर्माण किया जाता है -
numpy.dtype(object, align, copy)
पैरामीटर हैं -
Object - डेटा टाइप ऑब्जेक्ट में परिवर्तित होना
Align - यदि सही है, तो इसे सी-स्ट्रक्चर के समान बनाने के लिए फ़ील्ड में पैडिंग जोड़ता है
Copy- dtype ऑब्जेक्ट की एक नई कॉपी बनाता है। यदि गलत है, तो परिणाम अंतर्निहित डेटा प्रकार ऑब्जेक्ट के संदर्भ में है
उदाहरण 1
# using array-scalar type
import numpy as np
dt = np.dtype(np.int32)
print dt
आउटपुट इस प्रकार है -
int32
उदाहरण 2
#int8, int16, int32, int64 can be replaced by equivalent string 'i1', 'i2','i4', etc.
import numpy as np
dt = np.dtype('i4')
print dt
आउटपुट इस प्रकार है -
int32
उदाहरण 3
# using endian notation
import numpy as np
dt = np.dtype('>i4')
print dt
आउटपुट इस प्रकार है -
>i4
निम्न उदाहरण संरचित डेटा प्रकार का उपयोग दिखाते हैं। यहां, फ़ील्ड नाम और संबंधित स्केलर डेटा प्रकार घोषित किया जाना है।
उदाहरण 4
# first create structured data type
import numpy as np
dt = np.dtype([('age',np.int8)])
print dt
आउटपुट इस प्रकार है -
[('age', 'i1')]
उदाहरण 5
# now apply it to ndarray object
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print a
आउटपुट इस प्रकार है -
[(10,) (20,) (30,)]
उदाहरण 6
# file name can be used to access content of age column
import numpy as np
dt = np.dtype([('age',np.int8)])
a = np.array([(10,),(20,),(30,)], dtype = dt)
print a['age']
आउटपुट इस प्रकार है -
[10 20 30]
उदाहरण 7
निम्नलिखित उदाहरण एक संरचित डेटा प्रकार को परिभाषित करते हैं student एक स्ट्रिंग क्षेत्र 'नाम' के साथ, ए integer field 'उम्र' और ए float field'निशान'। यह dtype ndarray ऑब्जेक्ट पर लागू होता है।
import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
print student
आउटपुट इस प्रकार है -
[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')])
उदाहरण 8
import numpy as np
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')])
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student)
print a
आउटपुट इस प्रकार है -
[('abc', 21, 50.0), ('xyz', 18, 75.0)]
प्रत्येक अंतर्निहित डेटा प्रकार में एक वर्ण कोड होता है जो विशिष्ट रूप से इसकी पहचान करता है।
'b' - बूलियन
'i' - (हस्ताक्षरित) पूर्णांक
'u' - अहस्ताक्षरित पूर्णांक
'f' - फ्लोटिंग-पॉइंट
'c' - जटिल-अस्थायी बिंदु
'm' - टाइमलेटा
'M' - डेटाइम
'O' - (अजगर) पिंड
'S', 'a' - (बाइट-) स्ट्रिंग
'U' - यूनिकोड
'V' - कच्चा डेटा (शून्य)