Python - Configuration de l'environnement de science des données
Pour créer et exécuter avec succès l'exemple de code de ce didacticiel, nous aurons besoin d'un environnement configuré qui contiendra à la fois un python à usage général ainsi que les packages spéciaux requis pour la science des données. Nous allons d'abord regarder comme installer le python à usage général qui peut être python 2 ou python 3. Mais nous préférerons python 2 pour ce tutoriel principalement en raison de sa maturité et de son support plus large des packages externes.
Obtenir Python
Le code source, les binaires, la documentation, les actualités, etc. les plus à jour et les plus récents sont disponibles sur le site officiel de Python https://www.python.org/
Vous pouvez télécharger la documentation Python depuis https://www.python.org/doc/. La documentation est disponible aux formats HTML, PDF et PostScript.
Installer Python
La distribution Python est disponible pour une grande variété de plates-formes. Vous devez télécharger uniquement le code binaire applicable à votre plateforme et installer Python.
Si le code binaire de votre plateforme n'est pas disponible, vous avez besoin d'un compilateur C pour compiler le code source manuellement. La compilation du code source offre plus de flexibilité en termes de choix des fonctionnalités dont vous avez besoin dans votre installation.
Voici un bref aperçu de l'installation de Python sur différentes plates-formes -
Installation Unix et Linux
Voici les étapes simples pour installer Python sur une machine Unix / Linux.
Ouvrez un navigateur Web et accédez à https://www.python.org/downloads/.
Suivez le lien pour télécharger le code source compressé disponible pour Unix / Linux.
Téléchargez et extrayez des fichiers.
Modification du fichier Modules / Setup si vous souhaitez personnaliser certaines options.
exécuter le script ./configure
make
faire installer
Cela installe Python à l'emplacement standard / usr / local / bin et ses bibliothèques dans / usr / local / lib / pythonXX où XX est la version de Python.
Installation de Windows
Voici les étapes pour installer Python sur une machine Windows.
Ouvrez un navigateur Web et accédez à https://www.python.org/downloads/.
Suivez le lien pour le fichier d' installation de Windows python-XYZ.msi où XYZ est la version que vous devez installer.
Pour utiliser ce programme d'installation python-XYZ.msi , le système Windows doit prendre en charge Microsoft Installer 2.0. Enregistrez le fichier du programme d'installation sur votre ordinateur local, puis exécutez-le pour savoir si votre ordinateur prend en charge MSI.
Exécutez le fichier téléchargé. Cela fait apparaître l'assistant d'installation Python, qui est vraiment facile à utiliser. Acceptez simplement les paramètres par défaut, attendez que l'installation soit terminée et vous avez terminé.
Installation sur Macintosh
Les Mac récents sont livrés avec Python installé, mais il peut être obsolète de plusieurs années. Voirhttp://www.python.org/download/mac/pour obtenir des instructions sur l'obtention de la version actuelle ainsi que des outils supplémentaires pour prendre en charge le développement sur Mac. Pour les Mac OS plus anciens avant Mac OS X 10.3 (publié en 2003), MacPython est disponible.
Jack Jansen le maintient et vous pouvez avoir un accès complet à toute la documentation sur son site Web - http://www.cwi.nl/~jack/macpython.html. Vous pouvez trouver les détails d'installation complets pour l'installation de Mac OS.
Configurer PATH
Les programmes et autres fichiers exécutables peuvent se trouver dans de nombreux répertoires, de sorte que les systèmes d'exploitation fournissent un chemin de recherche qui répertorie les répertoires dans lesquels le système d'exploitation recherche les exécutables.
Le chemin est stocké dans une variable d'environnement, qui est une chaîne nommée gérée par le système d'exploitation. Cette variable contient des informations disponibles pour le shell de commande et d'autres programmes.
le path La variable est nommée PATH sous Unix ou Path sous Windows (Unix est sensible à la casse; Windows ne l'est pas).
Sous Mac OS, le programme d'installation gère les détails du chemin. Pour appeler l'interpréteur Python à partir d'un répertoire particulier, vous devez ajouter le répertoire Python à votre chemin.
Définition du chemin sous Unix / Linux
Pour ajouter le répertoire Python au chemin d'une session particulière sous Unix -
In the csh shell - tapez setenv PATH "$ PATH: / usr / local / bin / python" et appuyez sur Entrée.
In the bash shell (Linux) - tapez export ATH = "$ PATH: / usr / local / bin / python" et appuyez sur Entrée.
In the sh or ksh shell - tapez PATH = "$ PATH: / usr / local / bin / python" et appuyez sur Entrée.
Note - / usr / local / bin / python est le chemin du répertoire Python
Définition du chemin sous Windows
Pour ajouter le répertoire Python au chemin d'une session particulière dans Windows -
At the command prompt - tapez path% path%; C: \ Python et appuyez sur Entrée.
Note - C: \ Python est le chemin du répertoire Python
Variables d'environnement Python
Voici des variables d'environnement importantes, qui peuvent être reconnues par Python -
N ° Sr. | Variable et description |
---|---|
1 | PYTHONPATH Il a un rôle similaire à PATH. Cette variable indique à l'interpréteur Python où localiser les fichiers de module importés dans un programme. Il doit inclure le répertoire de la bibliothèque source Python et les répertoires contenant le code source Python. PYTHONPATH est parfois prédéfini par le programme d'installation Python. |
2 | PYTHONSTARTUP Il contient le chemin d'un fichier d'initialisation contenant le code source Python. Il est exécuté chaque fois que vous démarrez l'interpréteur. Il est nommé .pythonrc.py sous Unix et contient des commandes qui chargent des utilitaires ou modifient PYTHONPATH. |
3 | PYTHONCASEOK Il est utilisé dans Windows pour demander à Python de trouver la première correspondance insensible à la casse dans une instruction d'importation. Définissez cette variable sur n'importe quelle valeur pour l'activer. |
4 | PYTHONHOME Il s'agit d'un chemin de recherche de module alternatif. Il est généralement intégré dans les répertoires PYTHONSTARTUP ou PYTHONPATH pour faciliter le changement de bibliothèques de modules. |
Exécuter Python
Il existe trois façons différentes de démarrer Python -
Interprète interactif
Vous pouvez démarrer Python depuis Unix, DOS ou tout autre système qui vous fournit un interpréteur de ligne de commande ou une fenêtre shell.
Entrer python la ligne de commande.
Commencez immédiatement à coder dans l'interpréteur interactif.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Voici la liste de toutes les options de ligne de commande disponibles -
N ° Sr. | Option et description |
---|---|
1 | -d Il fournit une sortie de débogage. |
2 | -O Il génère un bytecode optimisé (résultant en des fichiers .pyo). |
3 | -S N'exécutez pas le site d'importation pour rechercher les chemins Python au démarrage. |
4 | -v sortie verbeuse (trace détaillée sur les instructions d'importation). |
5 | -X désactiver les exceptions intégrées basées sur les classes (utilisez simplement des chaînes); obsolète à partir de la version 1.6. |
6 | -c cmd exécuter le script Python envoyé en tant que chaîne cmd |
sept | file exécuter un script Python à partir d'un fichier donné |
Script depuis la ligne de commande
Un script Python peut être exécuté en ligne de commande en appelant l'interpréteur sur votre application, comme dans ce qui suit -
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - Assurez-vous que le mode d'autorisation de fichier permet l'exécution.
Environnement de développement intégré
Vous pouvez également exécuter Python à partir d'un environnement d'interface utilisateur graphique (GUI), si vous avez une application GUI sur votre système qui prend en charge Python.
Unix - IDLE est le tout premier IDE Unix pour Python.
Windows - PythonWin est la première interface Windows pour Python et est un IDE avec une interface graphique.
Macintosh - La version Macintosh de Python avec l'IDE IDLE est disponible sur le site principal, téléchargeable sous forme de fichiers MacBinary ou BinHex'd.
Installation de SciPy Pack
La meilleure façon d'activer les packs requis est d'utiliser un package binaire installable spécifique à votre système d'exploitation. Ces binaires contiennent une pile SciPy complète (y compris les packages NumPy, SciPy, matplotlib, IPython, SymPy et nose ainsi que le noyau Python).
les fenêtres
Anaconda (de www.continuum.io ) est une distribution Python gratuite pour la pile SciPy. Il est également disponible pour Linux et Mac.
Canopy ( www.enthought.com/products/canopy/ ) est disponible sous forme de distribution gratuite et commerciale avec une pile complète SciPy pour Windows, Linux et Mac.
Python (x, y): Il s'agit d'une distribution Python gratuite avec la pile SciPy et Spyder IDE pour Windows OS. (Téléchargeable sur www.python-xy.github.io/ )
Linux
Les gestionnaires de packages des distributions Linux respectives sont utilisés pour installer un ou plusieurs packages dans la pile SciPy.
Pour Ubuntu
sudo apt-get install python-numpy
python-scipy python-matplotlibipythonipythonnotebook python-pandas
python-sympy python-nose
Pour Fedora
sudo yum install numpyscipy python-matplotlibipython
python-pandas sympy python-nose atlas-devel
Construire à partir de la source
Core Python (à partir de 2.6.x, 2.7.x et 3.2.x) doit être installé avec distutils et le module zlib doit être activé.
Le compilateur C GNU gcc (4.2 et supérieur) doit être disponible.
Pour installer NumPy, exécutez la commande suivante.
Python setup.py install
Testons si le module NumPy est correctement installé, essayez de l'importer à partir de l'invite Python.
S'il n'est pas installé, le message d'erreur suivant s'affiche.
Traceback (most recent call last):
File "<pyshell#0>", line 1, in <module>
import numpy
ImportError: No module named 'numpy'
De même, nous pouvons vérifier l'installation de tous les packages Data Science requis indiqués dans les chapitres suivants.