पायथन - डेटा साइंस एनवायरनमेंट सेटअप
इस ट्यूटोरियल में उदाहरण कोड को सफलतापूर्वक बनाने और चलाने के लिए हमें एक ऐसे वातावरण की आवश्यकता होगी जिसमें सामान्य प्रयोजन के अजगर के साथ-साथ डेटा विज्ञान के लिए आवश्यक विशेष पैकेज भी हों। हम पहले सामान्य-उद्देश्य अजगर को स्थापित करने के रूप में देखेंगे जो कि अजगर 2 या अजगर 3 हो सकता है। लेकिन हम मुख्य रूप से इसकी परिपक्वता और बाहरी पैकेज के व्यापक समर्थन के कारण इस ट्यूटोरियल के लिए अजगर 2 पसंद करेंगे।
पायथन हो रही है
पायथन की आधिकारिक वेबसाइट पर सबसे अद्यतित और वर्तमान स्रोत कोड, बायनेरिज़, प्रलेखन, समाचार, आदि उपलब्ध है। https://www.python.org/
आप Python प्रलेखन को डाउनलोड कर सकते हैं https://www.python.org/doc/। प्रलेखन HTML, पीडीएफ और पोस्टस्क्रिप्ट स्वरूपों में उपलब्ध है।
पायथन की स्थापना
अजगर वितरण विभिन्न प्रकार के प्लेटफार्मों के लिए उपलब्ध है। आपको अपने प्लेटफ़ॉर्म के लिए लागू केवल बाइनरी कोड को डाउनलोड करने और पायथन को स्थापित करने की आवश्यकता है।
यदि आपके प्लेटफ़ॉर्म के लिए बाइनरी कोड उपलब्ध नहीं है, तो आपको मैन्युअल रूप से सोर्स कोड संकलित करने के लिए C कंपाइलर की आवश्यकता होगी। स्रोत कोड को संकलित करना उन विशेषताओं के विकल्प के संदर्भ में अधिक लचीलापन प्रदान करता है जिनकी आपको अपनी स्थापना में आवश्यकता होती है।
यहाँ विभिन्न प्लेटफार्मों पर अजगर स्थापित करने का एक त्वरित अवलोकन है -
यूनिक्स और लिनक्स इंस्टॉलेशन
यहां यूनिक्स / लिनक्स मशीन पर पायथन को स्थापित करने के सरल उपाय दिए गए हैं।
एक वेब ब्राउज़र खोलें और पर जाएं https://www.python.org/downloads/।
यूनिक्स / लिनक्स के लिए उपलब्ध ज़िप्ड सोर्स कोड डाउनलोड करने के लिए लिंक का पालन करें।
फ़ाइलों को डाउनलोड करें और निकालें।
यदि आप कुछ विकल्पों को अनुकूलित करना चाहते हैं, तो मॉड्यूल / सेटअप फ़ाइल का संपादन ।
रन ./configure स्क्रिप्ट
make
स्थापित करें
यह पायथन को मानक स्थान / usr / स्थानीय / बिन पर और इसके पुस्तकालयों को / usr / स्थानीय / lib / pythonXX पर स्थापित करता है जहां XX Python का संस्करण है।
विंडोज इंस्टॉलेशन
यहां विंडोज मशीन पर पायथन को स्थापित करने के चरण दिए गए हैं।
एक वेब ब्राउज़र खोलें और पर जाएं https://www.python.org/downloads/।
Windows इंस्टॉलर python-XYZ.msi फ़ाइल के लिए लिंक का पालन करें जहां XYZ वह संस्करण है जिसे आपको इंस्टॉल करने की आवश्यकता है।
इस इंस्टॉलर python-XYZ.msi का उपयोग करने के लिए , विंडोज सिस्टम को Microsoft इंस्टालर 2.0 का समर्थन करना चाहिए। अपने स्थानीय मशीन में इंस्टॉलर फ़ाइल को सहेजें और फिर यह पता लगाने के लिए इसे चलाएं कि क्या आपकी मशीन एमएसआई का समर्थन करती है।
डाउनलोड की गई फ़ाइल चलाएँ। यह पायथन स्थापित विज़ार्ड लाता है, जिसका उपयोग करना वास्तव में आसान है। बस डिफ़ॉल्ट सेटिंग्स को स्वीकार करें, इंस्टॉल समाप्त होने तक प्रतीक्षा करें, और आप कर रहे हैं।
लबादा स्थापना
हाल ही में मैक पायथन के साथ आए हैं, लेकिन यह कई साल पुराना हो सकता है। देखhttp://www.python.org/download/mac/मैक पर विकास का समर्थन करने के लिए अतिरिक्त उपकरणों के साथ वर्तमान संस्करण प्राप्त करने के निर्देश के लिए। मैक ओएस एक्स 10.3 (2003 में जारी) से पहले पुराने मैक ओएस के लिए, मैक पाइथन उपलब्ध है।
जैक जाॅनसन इसे बनाए रखते हैं और आप उनकी वेबसाइट पर पूरे दस्तावेज तक पहुंच सकते हैं - http://www.cwi.nl/~jack/macpython.html। आप Mac OS स्थापना के लिए पूर्ण स्थापना विवरण पा सकते हैं।
पथ की स्थापना
प्रोग्राम और अन्य निष्पादन योग्य फाइलें कई निर्देशिकाओं में हो सकती हैं, इसलिए ऑपरेटिंग सिस्टम एक खोज पथ प्रदान करता है जो उन निर्देशिकाओं को सूचीबद्ध करता है जो ओएस निष्पादनयोग्य के लिए खोजता है।
पथ को एक पर्यावरण चर में संग्रहीत किया जाता है, जो ऑपरेटिंग सिस्टम द्वारा बनाए गए एक स्ट्रिंग नाम है। इस चर में कमांड शेल और अन्य कार्यक्रमों के लिए उपलब्ध जानकारी है।
path वेरिएबल को विंडोज में PATH या पथ में नाम दिया गया है (Unix केस सेंसिटिव है; विंडोज नहीं है)।
मैक ओएस में, इंस्टॉलर पथ विवरण को संभालता है। किसी विशेष निर्देशिका से अजगर दुभाषिया को आमंत्रित करने के लिए, आपको अपने पथ पर पायथन निर्देशिका को जोड़ना होगा।
यूनिक्स / लिनक्स पर सेटिंग पथ
यूनिक्स में एक विशेष सत्र के लिए पथ निर्देशिका को जोड़ने के लिए -
In the csh shell - setenv PATH "$ PATH: / usr / local / bin / python" टाइप करें और एंटर दबाएं।
In the bash shell (Linux) - ATH = "$ PATH: / usr / local / bin / python" टाइप करें और एंटर दबाएं।
In the sh or ksh shell - PATH = "$ PATH: / usr / local / bin / python" टाइप करें और एंटर दबाएं।
Note - - usr / स्थानीय / बिन / अजगर अजगर की निर्देशिका का मार्ग है
विंडोज पर सेटिंग पथ
विंडोज में एक विशेष सत्र के लिए पथ निर्देशिका को जोड़ने के लिए -
At the command prompt - पथ% s पथ%; C: \ Python और Enter दबाएँ।
Note - C: \ Python, Python निर्देशिका का मार्ग है
अजगर पर्यावरण चर
यहां महत्वपूर्ण पर्यावरण चर हैं, जिन्हें पायथन द्वारा पहचाना जा सकता है -
अनु क्रमांक। | चर और विवरण |
---|---|
1 | PYTHONPATH इसमें PATH के समान भूमिका है। यह चर पायथन इंटरप्रेटर को बताता है जहां एक प्रोग्राम में आयातित मॉड्यूल फ़ाइलों का पता लगाने के लिए। इसमें पायथन स्रोत पुस्तकालय निर्देशिका और पायथन स्रोत कोड वाली निर्देशिकाएं शामिल होनी चाहिए। PYTHONPATH को कभी-कभी पायथन इंस्टॉलर द्वारा पूर्व निर्धारित किया जाता है। |
2 | PYTHONSTARTUP इसमें पायथन सोर्स कोड वाले इनिशियलाइज़ेशन फ़ाइल का पथ शामिल है। यह हर बार जब आप दुभाषिया शुरू करते हैं तब निष्पादित किया जाता है। इसे यूनिक्स में .pythonrc.py नाम दिया गया है और इसमें कमांड्स हैं जो उपयोगिताओं को लोड करते हैं या PYTHONPATH को संशोधित करते हैं। |
3 | PYTHONCASEOK इसका उपयोग विंडोज में पायथन को एक आयात विवरण में पहला केस-असंवेदनशील मैच खोजने के लिए निर्देश देने के लिए किया जाता है। इसे सक्रिय करने के लिए इस चर को किसी भी मान पर सेट करें। |
4 | PYTHONHOME यह एक वैकल्पिक मॉड्यूल खोज पथ है। स्विचिंग मॉड्यूल लाइब्रेरी को आसान बनाने के लिए इसे आमतौर पर PYTHONSTARTUP या PYTHONPATH निर्देशिका में एम्बेड किया जाता है। |
अजगर चला रहा है
पायथन शुरू करने के तीन अलग-अलग तरीके हैं -
इंटरएक्टिव दुभाषिया
आप यूनिक्स, डॉस या किसी अन्य प्रणाली से पायथन शुरू कर सकते हैं जो आपको कमांड-लाइन दुभाषिया या शेल विंडो प्रदान करता है।
दर्ज python कमांड लाइन।
इंटरैक्टिव दुभाषिया में तुरंत कोडिंग शुरू करें।
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
यहाँ सभी उपलब्ध कमांड लाइन विकल्पों की सूची दी गई है -
अनु क्रमांक। | विकल्प और विवरण |
---|---|
1 | -d यह डिबग आउटपुट प्रदान करता है। |
2 | -O यह अनुकूलित बायटेकोड उत्पन्न करता है (जिसके परिणामस्वरूप .pyo फ़ाइलें)। |
3 | -S स्टार्टअप पर अजगर पथ की तलाश के लिए आयात साइट न चलाएं। |
4 | -v वर्बोज़ आउटपुट (आयात विवरणों पर विस्तृत ट्रेस)। |
5 | -X क्लास-आधारित अंतर्निहित अपवादों को अक्षम करें (केवल स्ट्रिंग्स का उपयोग करें); संस्करण 1.6 के साथ अप्रचलित। |
6 | -c cmd cmd स्ट्रिंग के रूप में भेजा गया पायथन स्क्रिप्ट चलाएं |
7 | file पायथन स्क्रिप्ट दी गई फ़ाइल से चलाएँ |
कमांड-लाइन से स्क्रिप्ट
आपके आवेदन पर दुभाषिया को आमंत्रित करके पायथन स्क्रिप्ट को कमांड लाइन पर निष्पादित किया जा सकता है, जैसा कि निम्नलिखित में है -
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - सुनिश्चित करें कि फ़ाइल अनुमति मोड निष्पादन की अनुमति देता है।
समन्वित विकास पर्यावरण
आप एक ग्राफिकल यूजर इंटरफेस (GUI) वातावरण से भी Python चला सकते हैं, यदि आपके पास अपने सिस्टम पर GUI एप्लिकेशन है जो Python का समर्थन करता है।
Unix - पाइथन के लिए IDLE बहुत पहला यूनिक्स IDE है।
Windows - PythonWin पायथन के लिए पहला विंडोज इंटरफेस है और एक GUI के साथ एक IDE है।
Macintosh - IDLE IDE के साथ अजगर का Macintosh संस्करण मुख्य वेबसाइट से उपलब्ध है, जो MacBinary या BinHex'd फ़ाइलों के रूप में डाउनलोड करने योग्य है।
SciPy पैक स्थापित करना
आवश्यक पैक्स को सक्षम करने का सबसे अच्छा तरीका यह है कि आप अपने ऑपरेटिंग सिस्टम के लिए विशिष्ट किस्त बाइनरी पैकेज का उपयोग करें। इन बायनेरिज़ में पूर्ण SciPy स्टैक (NumPy, SciPy, matplotlib, IPython, SymPy और नाक के पैकेज के साथ कोर पायथन शामिल हैं)।
खिड़कियाँ
एनाकोंडा ( www.continuum.io से ) SciPy स्टैक के लिए एक मुफ्त पायथन वितरण है। यह लिनक्स और मैक के लिए भी उपलब्ध है।
कैनोपी ( www.enthought.com/products/canopy/ ) विंडोज, लिनक्स और मैक के लिए पूर्ण SciPy स्टैक के साथ ही मुफ्त में व्यावसायिक वितरण के रूप में उपलब्ध है।
पायथन (x, y): यह विंडोज OS के लिए SciPy स्टैक और स्पाइडर आईडीई के साथ एक मुफ्त पायथन वितरण है। ( Www.python-xy.github.io/ से डाउनलोड करने योग्य )
लिनक्स
संबंधित लिनक्स वितरण के पैकेज प्रबंधकों का उपयोग SciPy स्टैक में एक या अधिक पैकेज स्थापित करने के लिए किया जाता है।
उबंटू के लिए
sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose
फेडोरा के लिए
sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel
स्रोत से भवन
कोर पायथन (2.6.x, 2.7.x और 3.2.x आगे) को डिस्टुटिल्स के साथ स्थापित किया जाना चाहिए और zlib मॉड्यूल को सक्षम किया जाना चाहिए।
जीएनयू जीसीसी (4.2 और ऊपर) सी कंपाइलर उपलब्ध होना चाहिए।
NumPy को स्थापित करने के लिए, निम्न कमांड चलाएँ।
Python setup.py install
आइए हम परीक्षण करें कि क्या NumPy मॉड्यूल ठीक से स्थापित है, इसे पायथन प्रॉम्प्ट से आयात करने का प्रयास करें।
यदि यह स्थापित नहीं है, तो निम्न त्रुटि संदेश प्रदर्शित होगा।
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
import numpy
ImportError: No module named 'numpy'
इसी तरह हम अगले अध्यायों में दिखाए गए सभी आवश्यक डेटा विज्ञान संकुल की स्थापना के लिए जाँच कर सकते हैं।