NumPy - डेटा प्रकार

NumPy पायथन की तुलना में संख्यात्मक प्रकार के बहुत अधिक विविधता का समर्थन करता है। निम्न तालिका में विभिन्न स्केल डेटा प्रकारों को परिभाषित किया गया है।

अनु क्रमांक। डेटा प्रकार और विवरण
1

bool_

बूलियन (सच या गलत) एक बाइट के रूप में संग्रहीत

2

int_

डिफ़ॉल्ट पूर्णांक प्रकार (समान रूप से C लंबा; सामान्य रूप से या तो int64 या int32)

3

intc

C int की पहचान (सामान्य रूप से int32 या int64)

4

intp

अनुक्रमणिका के लिए उपयोग किए जाने वाले पूर्णांक (सी ssize_t के रूप में (सामान्य रूप से या तो इंट 32 या int64)

5

int8

बाइट -128 (127 से 127)

6

int16

पूर्णांक (-32768 से 32767)

7

int32

इंटेगर (-2147483648 से 2147483647)

8

int64

इंटेगर (-922337203685474780808 to 9223372036854775807)

9

uint8

अहस्ताक्षरित पूर्णांक (0 से 255)

10

uint16

निरुपित पूर्णांक (0 से 65535)

1 1

uint32

निरुपित पूर्णांक (0 से 4294967295)

12

uint64

निरुपित पूर्णांक (0 से 18446744073709551615)

13

float_

फ्लोट64 के लिए शॉर्टहैंड

14

float16

आधा सटीक फ्लोट: साइन बिट, 5 बिट एक्सपेंसर, 10 बिट मंटिसा

15

float32

एकल परिशुद्धता फ्लोट: साइन बिट, 8 बिट एक्सपेंसर, 23 बिट्स मंटिसा

16

float64

डबल सटीक फ्लोट: साइन बिट, 11 बिट्स घातांक, 52 बिट्स मंटिसा

17

complex_

कॉम्पलेक्स128 के लिए शॉर्टहैंड

18

complex64

जटिल संख्या, दो 32-बिट फ्लोट्स द्वारा प्रस्तुत (वास्तविक और काल्पनिक घटक)

19

complex128

जटिल संख्या, दो 64-बिट फ्लोट्स द्वारा प्रस्तुत (वास्तविक और काल्पनिक घटक)

NumPy संख्यात्मक प्रकार dtype (डेटा-प्रकार) ऑब्जेक्ट्स के उदाहरण हैं, जिनमें से प्रत्येक में अद्वितीय विशेषताएं हैं। Dtypes np.bool_, np.float32, आदि के रूप में उपलब्ध हैं।

डेटा प्रकार ऑब्जेक्ट (dtype)

एक डेटा प्रकार ऑब्जेक्ट एक सरणी के अनुरूप मेमोरी के निश्चित ब्लॉक की व्याख्या का वर्णन करता है, जो निम्न पहलुओं पर निर्भर करता है -

  • डेटा का प्रकार (पूर्णांक, फ्लोट या पायथन ऑब्जेक्ट)

  • डेटा का आकार

  • बाइट ऑर्डर (छोटा-एंडियन या बड़ा-एंडियन)

  • संरचित प्रकार के मामले में, फ़ील्ड के नाम, प्रत्येक फ़ील्ड के डेटा प्रकार और प्रत्येक फ़ील्ड द्वारा लिए गए मेमोरी ब्लॉक का हिस्सा।

  • यदि डेटा प्रकार एक उप-प्रकार है, तो इसका आकार और डेटा प्रकार

बाइट ऑर्डर को डेटा टाइप के लिए '<' या '>' प्रीफ़िक्स करके तय किया जाता है। '<' का अर्थ है कि एन्कोडिंग छोटा-सा एंडियन है (कम से कम महत्वपूर्ण को सबसे छोटे पते में संग्रहीत किया जाता है)। '>' का अर्थ है कि एन्कोडिंग बड़ा-एंडियन (सबसे महत्वपूर्ण बाइट सबसे छोटे पते में संग्रहीत है)।

निम्नलिखित सिंटैक्स का उपयोग करके एक dtype ऑब्जेक्ट का निर्माण किया जाता है -

numpy.dtype(object, align, copy)

पैरामीटर हैं -

  • Object - डेटा टाइप ऑब्जेक्ट में परिवर्तित होना

  • Align - यदि सही है, तो इसे सी-स्ट्रक्चर के समान बनाने के लिए फ़ील्ड में पैडिंग जोड़ता है

  • Copy- dtype ऑब्जेक्ट की एक नई कॉपी बनाता है। यदि गलत है, तो परिणाम अंतर्निहित डेटा प्रकार ऑब्जेक्ट के संदर्भ में है

उदाहरण 1

# using array-scalar type 
import numpy as np 
dt = np.dtype(np.int32) 
print dt

आउटपुट इस प्रकार है -

int32

उदाहरण 2

#int8, int16, int32, int64 can be replaced by equivalent string 'i1', 'i2','i4', etc. 
import numpy as np 

dt = np.dtype('i4')
print dt

आउटपुट इस प्रकार है -

int32

उदाहरण 3

# using endian notation 
import numpy as np 
dt = np.dtype('>i4') 
print dt

आउटपुट इस प्रकार है -

>i4

निम्न उदाहरण संरचित डेटा प्रकार का उपयोग दिखाते हैं। यहां, फ़ील्ड नाम और संबंधित स्केलर डेटा प्रकार घोषित किया जाना है।

उदाहरण 4

# first create structured data type 
import numpy as np 
dt = np.dtype([('age',np.int8)]) 
print dt

आउटपुट इस प्रकार है -

[('age', 'i1')]

उदाहरण 5

# now apply it to ndarray object 
import numpy as np 

dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print a

आउटपुट इस प्रकार है -

[(10,) (20,) (30,)]

उदाहरण 6

# file name can be used to access content of age column 
import numpy as np 

dt = np.dtype([('age',np.int8)]) 
a = np.array([(10,),(20,),(30,)], dtype = dt) 
print a['age']

आउटपुट इस प्रकार है -

[10 20 30]

उदाहरण 7

निम्नलिखित उदाहरण एक संरचित डेटा प्रकार को परिभाषित करते हैं student एक स्ट्रिंग क्षेत्र 'नाम' के साथ, ए integer field 'उम्र' और ए float field'निशान'। यह dtype ndarray ऑब्जेक्ट पर लागू होता है।

import numpy as np 
student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')]) 
print student

आउटपुट इस प्रकार है -

[('name', 'S20'), ('age', 'i1'), ('marks', '<f4')])

उदाहरण 8

import numpy as np 

student = np.dtype([('name','S20'), ('age', 'i1'), ('marks', 'f4')]) 
a = np.array([('abc', 21, 50),('xyz', 18, 75)], dtype = student) 
print a

आउटपुट इस प्रकार है -

[('abc', 21, 50.0), ('xyz', 18, 75.0)]

प्रत्येक अंतर्निहित डेटा प्रकार में एक वर्ण कोड होता है जो विशिष्ट रूप से इसकी पहचान करता है।

  • 'b' - बूलियन

  • 'i' - (हस्ताक्षरित) पूर्णांक

  • 'u' - अहस्ताक्षरित पूर्णांक

  • 'f' - फ्लोटिंग-पॉइंट

  • 'c' - जटिल-अस्थायी बिंदु

  • 'm' - टाइमलेटा

  • 'M' - डेटाइम

  • 'O' - (अजगर) पिंड

  • 'S', 'a' - (बाइट-) स्ट्रिंग

  • 'U' - यूनिकोड

  • 'V' - कच्चा डेटा (शून्य)