पायथन - डेटा साइंस एनवायरनमेंट सेटअप

इस ट्यूटोरियल में उदाहरण कोड को सफलतापूर्वक बनाने और चलाने के लिए हमें एक ऐसे वातावरण की आवश्यकता होगी जिसमें सामान्य प्रयोजन के अजगर के साथ-साथ डेटा विज्ञान के लिए आवश्यक विशेष पैकेज भी हों। हम पहले सामान्य-उद्देश्य अजगर को स्थापित करने के रूप में देखेंगे जो कि अजगर 2 या अजगर 3 हो सकता है। लेकिन हम मुख्य रूप से इसकी परिपक्वता और बाहरी पैकेज के व्यापक समर्थन के कारण इस ट्यूटोरियल के लिए अजगर 2 पसंद करेंगे।

पायथन हो रही है

पायथन की आधिकारिक वेबसाइट पर सबसे अद्यतित और वर्तमान स्रोत कोड, बायनेरिज़, प्रलेखन, समाचार, आदि उपलब्ध है। https://www.python.org/

आप Python प्रलेखन को डाउनलोड कर सकते हैं https://www.python.org/doc/। प्रलेखन HTML, पीडीएफ और पोस्टस्क्रिप्ट स्वरूपों में उपलब्ध है।

पायथन की स्थापना

अजगर वितरण विभिन्न प्रकार के प्लेटफार्मों के लिए उपलब्ध है। आपको अपने प्लेटफ़ॉर्म के लिए लागू केवल बाइनरी कोड को डाउनलोड करने और पायथन को स्थापित करने की आवश्यकता है।

यदि आपके प्लेटफ़ॉर्म के लिए बाइनरी कोड उपलब्ध नहीं है, तो आपको मैन्युअल रूप से सोर्स कोड संकलित करने के लिए C कंपाइलर की आवश्यकता होगी। स्रोत कोड को संकलित करना उन विशेषताओं के विकल्प के संदर्भ में अधिक लचीलापन प्रदान करता है जिनकी आपको अपनी स्थापना में आवश्यकता होती है।

यहाँ विभिन्न प्लेटफार्मों पर अजगर स्थापित करने का एक त्वरित अवलोकन है -

यूनिक्स और लिनक्स इंस्टॉलेशन

यहां यूनिक्स / लिनक्स मशीन पर पायथन को स्थापित करने के सरल उपाय दिए गए हैं।

  • एक वेब ब्राउज़र खोलें और पर जाएं https://www.python.org/downloads/।

  • यूनिक्स / लिनक्स के लिए उपलब्ध ज़िप्ड सोर्स कोड डाउनलोड करने के लिए लिंक का पालन करें।

  • फ़ाइलों को डाउनलोड करें और निकालें।

  • यदि आप कुछ विकल्पों को अनुकूलित करना चाहते हैं, तो मॉड्यूल / सेटअप फ़ाइल का संपादन ।

  • रन ./configure स्क्रिप्ट

  • make

  • स्थापित करें

यह पायथन को मानक स्थान / usr / स्थानीय / बिन पर और इसके पुस्तकालयों को / usr / स्थानीय / lib / pythonXX पर स्थापित करता है जहां XX Python का संस्करण है।

विंडोज इंस्टॉलेशन

यहां विंडोज मशीन पर पायथन को स्थापित करने के चरण दिए गए हैं।

  • एक वेब ब्राउज़र खोलें और पर जाएं https://www.python.org/downloads/।

  • Windows इंस्टॉलर python-XYZ.msi फ़ाइल के लिए लिंक का पालन करें जहां XYZ वह संस्करण है जिसे आपको इंस्टॉल करने की आवश्यकता है।

  • इस इंस्टॉलर python-XYZ.msi का उपयोग करने के लिए , विंडोज सिस्टम को Microsoft इंस्टालर 2.0 का समर्थन करना चाहिए। अपने स्थानीय मशीन में इंस्टॉलर फ़ाइल को सहेजें और फिर यह पता लगाने के लिए इसे चलाएं कि क्या आपकी मशीन एमएसआई का समर्थन करती है।

  • डाउनलोड की गई फ़ाइल चलाएँ। यह पायथन स्थापित विज़ार्ड लाता है, जिसका उपयोग करना वास्तव में आसान है। बस डिफ़ॉल्ट सेटिंग्स को स्वीकार करें, इंस्टॉल समाप्त होने तक प्रतीक्षा करें, और आप कर रहे हैं।

लबादा स्थापना

हाल ही में मैक पायथन के साथ आए हैं, लेकिन यह कई साल पुराना हो सकता है। देखhttp://www.python.org/download/mac/मैक पर विकास का समर्थन करने के लिए अतिरिक्त उपकरणों के साथ वर्तमान संस्करण प्राप्त करने के निर्देश के लिए। मैक ओएस एक्स 10.3 (2003 में जारी) से पहले पुराने मैक ओएस के लिए, मैक पाइथन उपलब्ध है।

जैक जाॅनसन इसे बनाए रखते हैं और आप उनकी वेबसाइट पर पूरे दस्तावेज तक पहुंच सकते हैं - http://www.cwi.nl/~jack/macpython.html। आप Mac OS स्थापना के लिए पूर्ण स्थापना विवरण पा सकते हैं।

पथ की स्थापना

प्रोग्राम और अन्य निष्पादन योग्य फाइलें कई निर्देशिकाओं में हो सकती हैं, इसलिए ऑपरेटिंग सिस्टम एक खोज पथ प्रदान करता है जो उन निर्देशिकाओं को सूचीबद्ध करता है जो ओएस निष्पादनयोग्य के लिए खोजता है।

पथ को एक पर्यावरण चर में संग्रहीत किया जाता है, जो ऑपरेटिंग सिस्टम द्वारा बनाए गए एक स्ट्रिंग नाम है। इस चर में कमांड शेल और अन्य कार्यक्रमों के लिए उपलब्ध जानकारी है।

path वेरिएबल को विंडोज में PATH या पथ में नाम दिया गया है (Unix केस सेंसिटिव है; विंडोज नहीं है)।

मैक ओएस में, इंस्टॉलर पथ विवरण को संभालता है। किसी विशेष निर्देशिका से अजगर दुभाषिया को आमंत्रित करने के लिए, आपको अपने पथ पर पायथन निर्देशिका को जोड़ना होगा।

यूनिक्स / लिनक्स पर सेटिंग पथ

यूनिक्स में एक विशेष सत्र के लिए पथ निर्देशिका को जोड़ने के लिए -

  • In the csh shell - setenv PATH "$ PATH: / usr / local / bin / python" टाइप करें और एंटर दबाएं।

  • In the bash shell (Linux) - ATH = "$ PATH: / usr / local / bin / python" टाइप करें और एंटर दबाएं।

  • In the sh or ksh shell - PATH = "$ PATH: / usr / local / bin / python" टाइप करें और एंटर दबाएं।

  • Note - - usr / स्थानीय / बिन / अजगर अजगर की निर्देशिका का मार्ग है

विंडोज पर सेटिंग पथ

विंडोज में एक विशेष सत्र के लिए पथ निर्देशिका को जोड़ने के लिए -

At the command prompt - पथ% s पथ%; C: \ Python और Enter दबाएँ।

Note - C: \ Python, Python निर्देशिका का मार्ग है

अजगर पर्यावरण चर

यहां महत्वपूर्ण पर्यावरण चर हैं, जिन्हें पायथन द्वारा पहचाना जा सकता है -

अनु क्रमांक। चर और विवरण
1

PYTHONPATH

इसमें PATH के समान भूमिका है। यह चर पायथन इंटरप्रेटर को बताता है जहां एक प्रोग्राम में आयातित मॉड्यूल फ़ाइलों का पता लगाने के लिए। इसमें पायथन स्रोत पुस्तकालय निर्देशिका और पायथन स्रोत कोड वाली निर्देशिकाएं शामिल होनी चाहिए। PYTHONPATH को कभी-कभी पायथन इंस्टॉलर द्वारा पूर्व निर्धारित किया जाता है।

2

PYTHONSTARTUP

इसमें पायथन सोर्स कोड वाले इनिशियलाइज़ेशन फ़ाइल का पथ शामिल है। यह हर बार जब आप दुभाषिया शुरू करते हैं तब निष्पादित किया जाता है। इसे यूनिक्स में .pythonrc.py नाम दिया गया है और इसमें कमांड्स हैं जो उपयोगिताओं को लोड करते हैं या PYTHONPATH को संशोधित करते हैं।

3

PYTHONCASEOK

इसका उपयोग विंडोज में पायथन को एक आयात विवरण में पहला केस-असंवेदनशील मैच खोजने के लिए निर्देश देने के लिए किया जाता है। इसे सक्रिय करने के लिए इस चर को किसी भी मान पर सेट करें।

4

PYTHONHOME

यह एक वैकल्पिक मॉड्यूल खोज पथ है। स्विचिंग मॉड्यूल लाइब्रेरी को आसान बनाने के लिए इसे आमतौर पर PYTHONSTARTUP या PYTHONPATH निर्देशिका में एम्बेड किया जाता है।

अजगर चला रहा है

पायथन शुरू करने के तीन अलग-अलग तरीके हैं -

इंटरएक्टिव दुभाषिया

आप यूनिक्स, डॉस या किसी अन्य प्रणाली से पायथन शुरू कर सकते हैं जो आपको कमांड-लाइन दुभाषिया या शेल विंडो प्रदान करता है।

दर्ज python कमांड लाइन।

इंटरैक्टिव दुभाषिया में तुरंत कोडिंग शुरू करें।

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

यहाँ सभी उपलब्ध कमांड लाइन विकल्पों की सूची दी गई है -

अनु क्रमांक। विकल्प और विवरण
1

-d

यह डिबग आउटपुट प्रदान करता है।

2

-O

यह अनुकूलित बायटेकोड उत्पन्न करता है (जिसके परिणामस्वरूप .pyo फ़ाइलें)।

3

-S

स्टार्टअप पर अजगर पथ की तलाश के लिए आयात साइट न चलाएं।

4

-v

वर्बोज़ आउटपुट (आयात विवरणों पर विस्तृत ट्रेस)।

5

-X

क्लास-आधारित अंतर्निहित अपवादों को अक्षम करें (केवल स्ट्रिंग्स का उपयोग करें); संस्करण 1.6 के साथ अप्रचलित।

6

-c cmd

cmd स्ट्रिंग के रूप में भेजा गया पायथन स्क्रिप्ट चलाएं

7

file

पायथन स्क्रिप्ट दी गई फ़ाइल से चलाएँ

कमांड-लाइन से स्क्रिप्ट

आपके आवेदन पर दुभाषिया को आमंत्रित करके पायथन स्क्रिप्ट को कमांड लाइन पर निष्पादित किया जा सकता है, जैसा कि निम्नलिखित में है -

$python script.py # Unix/Linux

or

python% script.py # Unix/Linux

or 

C: >python script.py # Windows/DOS

Note - सुनिश्चित करें कि फ़ाइल अनुमति मोड निष्पादन की अनुमति देता है।

समन्वित विकास पर्यावरण

आप एक ग्राफिकल यूजर इंटरफेस (GUI) वातावरण से भी Python चला सकते हैं, यदि आपके पास अपने सिस्टम पर GUI एप्लिकेशन है जो Python का समर्थन करता है।

  • Unix - पाइथन के लिए IDLE बहुत पहला यूनिक्स IDE है।

  • Windows - PythonWin पायथन के लिए पहला विंडोज इंटरफेस है और एक GUI के साथ एक IDE है।

  • Macintosh - IDLE IDE के साथ अजगर का Macintosh संस्करण मुख्य वेबसाइट से उपलब्ध है, जो MacBinary या BinHex'd फ़ाइलों के रूप में डाउनलोड करने योग्य है।

SciPy पैक स्थापित करना

आवश्यक पैक्स को सक्षम करने का सबसे अच्छा तरीका यह है कि आप अपने ऑपरेटिंग सिस्टम के लिए विशिष्ट किस्त बाइनरी पैकेज का उपयोग करें। इन बायनेरिज़ में पूर्ण SciPy स्टैक (NumPy, SciPy, matplotlib, IPython, SymPy और नाक के पैकेज के साथ कोर पायथन शामिल हैं)।

खिड़कियाँ

एनाकोंडा ( www.continuum.io से ) SciPy स्टैक के लिए एक मुफ्त पायथन वितरण है। यह लिनक्स और मैक के लिए भी उपलब्ध है।

कैनोपी ( www.enthought.com/products/canopy/ ) विंडोज, लिनक्स और मैक के लिए पूर्ण SciPy स्टैक के साथ ही मुफ्त में व्यावसायिक वितरण के रूप में उपलब्ध है।

पायथन (x, y): यह विंडोज OS के लिए SciPy स्टैक और स्पाइडर आईडीई के साथ एक मुफ्त पायथन वितरण है। ( Www.python-xy.github.io/ से डाउनलोड करने योग्य )

लिनक्स

संबंधित लिनक्स वितरण के पैकेज प्रबंधकों का उपयोग SciPy स्टैक में एक या अधिक पैकेज स्थापित करने के लिए किया जाता है।

उबंटू के लिए

sudo apt-get install python-numpy 
python-scipy python-matplotlibipythonipythonnotebook python-pandas 
python-sympy python-nose

फेडोरा के लिए

sudo yum install numpyscipy python-matplotlibipython 
python-pandas sympy python-nose atlas-devel

स्रोत से भवन

कोर पायथन (2.6.x, 2.7.x और 3.2.x आगे) को डिस्टुटिल्स के साथ स्थापित किया जाना चाहिए और zlib मॉड्यूल को सक्षम किया जाना चाहिए।

जीएनयू जीसीसी (4.2 और ऊपर) सी कंपाइलर उपलब्ध होना चाहिए।

NumPy को स्थापित करने के लिए, निम्न कमांड चलाएँ।

Python setup.py install

आइए हम परीक्षण करें कि क्या NumPy मॉड्यूल ठीक से स्थापित है, इसे पायथन प्रॉम्प्ट से आयात करने का प्रयास करें।

यदि यह स्थापित नहीं है, तो निम्न त्रुटि संदेश प्रदर्शित होगा।

Traceback (most recent call last): 
   File "<pyshell#0>", line 1, in <module> 
      import numpy 
ImportError: No module named 'numpy'

इसी तरह हम अगले अध्यायों में दिखाए गए सभी आवश्यक डेटा विज्ञान संकुल की स्थापना के लिए जाँच कर सकते हैं।