ऑब्जेक्ट ओरिएंटेड पायथन - फाइल्स एंड स्ट्रिंग्स
स्ट्रिंग्स
स्ट्रिंग्स प्रत्येक प्रोग्रामिंग भाषा में उपयोग किए जाने वाले सबसे लोकप्रिय डेटा प्रकार हैं। क्यों? क्योंकि हम पाठ को संख्याओं से बेहतर समझते हैं, इसलिए लेखन और बातचीत में हम पाठ और शब्दों का उपयोग करते हैं, उसी प्रकार प्रोग्रामिंग में भी हम तार का उपयोग करते हैं। स्ट्रिंग में हम पाठ को पार्स करते हैं, पाठ शब्दार्थ का विश्लेषण करते हैं, और डेटा माइनिंग करते हैं - और यह सब डेटा मानव उपभोग वाला पाठ है। पायथन में स्ट्रिंग अपरिवर्तनीय है।
स्ट्रिंग हेरफेर
पायथन में, मल्टीलाइन स्ट्रिंग्स के मामले में सिंगल कोट ('), डबल कोट (") या यहां तक कि ट्रिपल कोट (' '') का उपयोग करके स्ट्रिंग को कई तरीकों से चिह्नित किया जा सकता है।
>>> # String Examples
>>> a = "hello"
>>> b = ''' A Multi line string,
Simple!'''
>>> e = ('Multiple' 'strings' 'togethers')
स्ट्रिंग हेरफेर बहुत उपयोगी है और हर भाषा में बहुत व्यापक रूप से उपयोग किया जाता है। अक्सर, प्रोग्रामर को तार को तोड़ने और उन्हें बारीकी से जांचने की आवश्यकता होती है।
स्ट्रिंग्स को (चरित्र द्वारा चरित्र), कटा हुआ या संक्षिप्त किया जा सकता है। सिंटैक्स सूची के लिए समान है।
स्ट्रिंग्स को हेरफेर करने में आसान बनाने के लिए स्ट्रैस क्लास के पास कई तरीके हैं। दिर और हेल्प कमांड पायथन इंटरप्रेटर में मार्गदर्शन प्रदान करता है कि उनका उपयोग कैसे किया जाए।
नीचे आमतौर पर उपयोग किए जाने वाले कुछ स्ट्रिंग तरीकों का उपयोग किया जाता है।
अनु क्रमांक। | विधि और विवरण |
---|---|
1 | isalpha() जाँचता है कि क्या सभी वर्ण अक्षर हैं |
2 | isdigit() अंक अक्षर की जाँच करता है |
3 | isdecimal() दशमलव वर्ण की जाँच करता है |
4 | isnumeric() संख्यात्मक वर्णों की जाँच करता है |
5 | find() सबस्ट्रिंग के उच्चतम सूचकांक को लौटाता है |
6 | istitle() शीर्षक वाले तार के लिए जाँच |
7 | join() एक संक्षिप्त स्ट्रिंग लौटाता है |
8 | lower() कम आवरण स्ट्रिंग देता है |
9 | upper() ऊपरी आवरण स्ट्रिंग देता है |
10 | partion() टपल लौटाता है |
1 1 | bytearray() दिए गए बाइट का आकार देता है |
12 | enumerate() एक enumerate वस्तु देता है |
13 | isprintable() प्रिंट करने योग्य चरित्र की जाँच करता है |
आइए कुछ जोड़ी स्ट्रिंग विधियों को चलाने का प्रयास करें,
>>> str1 = 'Hello World!'
>>> str1.startswith('h')
False
>>> str1.startswith('H')
True
>>> str1.endswith('d')
False
>>> str1.endswith('d!')
True
>>> str1.find('o')
4
>>> #Above returns the index of the first occurence of the character/substring.
>>> str1.find('lo')
3
>>> str1.upper()
'HELLO WORLD!'
>>> str1.lower()
'hello world!'
>>> str1.index('b')
Traceback (most recent call last):
File "<pyshell#19>", line 1, in <module>
str1.index('b')
ValueError: substring not found
>>> s = ('hello How Are You')
>>> s.split(' ')
['hello', 'How', 'Are', 'You']
>>> s1 = s.split(' ')
>>> '*'.join(s1)
'hello*How*Are*You'
>>> s.partition(' ')
('hello', ' ', 'How Are You')
>>>
स्ट्रिंग स्वरूपण
पाइथन में 3. स्ट्रिंग्स का फॉरमेट बदल गया है, अब यह अधिक तार्किक है और अधिक लचीला है। स्वरूपण () पद्धति या प्रारूप स्ट्रिंग में% चिह्न (पुरानी शैली) का उपयोग करके किया जा सकता है।
स्ट्रिंग में ब्रेसिज़ {} द्वारा शाब्दिक पाठ या प्रतिस्थापन फ़ील्ड शामिल हो सकते हैं और प्रत्येक प्रतिस्थापन फ़ील्ड में या तो स्थितीय तर्क का संख्यात्मक सूचकांक या कीवर्ड तर्क का नाम हो सकता है।
वाक्य - विन्यास
str.format(*args, **kwargs)
मूल स्वरूपण
>>> '{} {}'.format('Example', 'One')
'Example One'
>>> '{} {}'.format('pie', '3.1415926')
'pie 3.1415926'
नीचे दिए गए उदाहरण तर्कों को बदलने के बिना प्रदर्शन के क्रम को फिर से व्यवस्थित करने की अनुमति देता है।
>>> '{1} {0}'.format('pie', '3.1415926')
'3.1415926 pie'
पैडिंग और संरेखित तार
एक मान को एक विशिष्ट लंबाई तक गद्देदार किया जा सकता है।
>>> #Padding Character, can be space or special character
>>> '{:12}'.format('PYTHON')
'PYTHON '
>>> '{:>12}'.format('PYTHON')
' PYTHON'
>>> '{:<{}s}'.format('PYTHON',12)
'PYTHON '
>>> '{:*<12}'.format('PYTHON')
'PYTHON******'
>>> '{:*^12}'.format('PYTHON')
'***PYTHON***'
>>> '{:.15}'.format('PYTHON OBJECT ORIENTED PROGRAMMING')
'PYTHON OBJECT O'
>>> #Above, truncated 15 characters from the left side of a specified string
>>> '{:.{}}'.format('PYTHON OBJECT ORIENTED',15)
'PYTHON OBJECT O'
>>> #Named Placeholders
>>> data = {'Name':'Raghu', 'Place':'Bangalore'}
>>> '{Name} {Place}'.format(**data)
'Raghu Bangalore'
>>> #Datetime
>>> from datetime import datetime
>>> '{:%Y/%m/%d.%H:%M}'.format(datetime(2018,3,26,9,57))
'2018/03/26.09:57'
स्ट्रिंग्स यूनिकोड हैं
अपरिवर्तनीय यूनिकोड पात्रों के संग्रह के रूप में स्ट्रिंग्स। यूनिकोड के तार एक ऐसा सॉफ़्टवेयर या प्रोग्राम बनाने का अवसर प्रदान करते हैं जो हर जगह काम करता है क्योंकि यूनिकोड के तार किसी भी संभावित चरित्र का प्रतिनिधित्व नहीं कर सकते हैं, न कि केवल ASCII वर्ण।
कई आईओ ऑपरेशन केवल बाइट्स से निपटने का तरीका जानते हैं, भले ही बाइट ऑब्जेक्ट टेक्स्ट डेटा को संदर्भित करता हो। इसलिए यह जानना बहुत महत्वपूर्ण है कि बाइट्स और यूनिकोड के बीच विनिमय कैसे किया जाए।
पाठ को बाइट्स में परिवर्तित करना
एक बाइट को बाइट ऑब्जेक्ट में बदलना एन्कोडिंग के रूप में कहा जाता है। एन्कोडिंग के कई रूप हैं, सबसे आम हैं: पीएनजी; JPEG, MP3, WAV, ASCII, UTF-8 आदि। यह भी (एन्कोडिंग) बाइट्स में ऑडियो, इमेज, टेक्स्ट आदि को दर्शाने के लिए एक प्रारूप है।
यह रूपांतरण एनकोड () के माध्यम से संभव है। यह तर्क के रूप में एन्कोडिंग तकनीक लेता है। डिफ़ॉल्ट रूप से, हम 'UTF-8' तकनीक का उपयोग करते हैं।
>>> # Python Code to demonstrate string encoding
>>>
>>> # Initialising a String
>>> x = 'TutorialsPoint'
>>>
>>> #Initialising a byte object
>>> y = b'TutorialsPoint'
>>>
>>> # Using encode() to encode the String >>> # encoded version of x is stored in z using ASCII mapping
>>> z = x.encode('ASCII')
>>>
>>> # Check if x is converted to bytes or not
>>>
>>> if(z==y):
print('Encoding Successful!')
else:
print('Encoding Unsuccessful!')
Encoding Successful!
Converting bytes to text
बाइट्स को टेक्स्ट में बदलना डिकोडिंग कहलाता है। यह डिकोड () के माध्यम से कार्यान्वित किया जाता है। हम एक बाइट स्ट्रिंग को एक वर्ण स्ट्रिंग में बदल सकते हैं यदि हम जानते हैं कि इसे एन्कोड करने के लिए किस एन्कोडिंग का उपयोग किया जाता है।
तो एनकोडिंग और डिकोडिंग व्युत्क्रम प्रक्रियाएं हैं।
>>>
>>> # Python code to demonstrate Byte Decoding
>>>
>>> #Initialise a String
>>> x = 'TutorialsPoint'
>>>
>>> #Initialising a byte object
>>> y = b'TutorialsPoint'
>>>
>>> #using decode() to decode the Byte object
>>> # decoded version of y is stored in z using ASCII mapping
>>> z = y.decode('ASCII')
>>> #Check if y is converted to String or not
>>> if (z == x):
print('Decoding Successful!')
else:
print('Decoding Unsuccessful!') Decoding Successful!
>>>
फ़ाइल I / O
ऑपरेटिंग सिस्टम बाइट्स के अनुक्रम के रूप में फाइलों का प्रतिनिधित्व करता है, न कि टेक्स्ट का।
संबंधित जानकारी को संग्रहीत करने के लिए डिस्क पर एक फ़ाइल एक नामित स्थान है। इसका उपयोग आपकी डिस्क में डेटा को स्थायी रूप से संग्रहीत करने के लिए किया जाता है।
पायथन में, एक फ़ाइल ऑपरेशन निम्न क्रम में होता है।
- एक फ़ाइल खोलो
- किसी फ़ाइल (ऑपरेशन) पर पढ़ें या लिखें। किसी फ़ाइल को खोलें
- फ़ाइल बंद करें।
पाइथन बाइट्स के इनकमिंग (या आउटगोइंग) स्ट्रीम को उचित डिकोड (या एनकोड) कॉल के साथ लपेटता है ताकि हम स्ट्रेट ऑब्जेक्ट से सीधे निपट सकें।
एक फ़ाइल खोलना
पायथन में एक फ़ाइल खोलने के लिए एक अंतर्निहित फ़ंक्शन ओपन () है। यह एक फ़ाइल ऑब्जेक्ट उत्पन्न करेगा, जिसे हैंडल भी कहा जाता है क्योंकि इसका उपयोग फ़ाइल को पढ़ने या उसके अनुसार संशोधित करने के लिए किया जाता है।
>>> f = open(r'c:\users\rajesh\Desktop\index.webm','rb')
>>> f
<_io.BufferedReader name='c:\\users\\rajesh\\Desktop\\index.webm'>
>>> f.mode
'rb'
>>> f.name
'c:\\users\\rajesh\\Desktop\\index.webm'
किसी फ़ाइल से पाठ पढ़ने के लिए, हमें केवल फ़ंक्शन में फ़ाइल नाम देना होगा। फ़ाइल पढ़ने के लिए खोली जाएगी, और बाइट्स को प्लेटफ़ॉर्म डिफ़ॉल्ट एन्कोडिंग का उपयोग करके पाठ में परिवर्तित किया जाएगा।