Python - Environnement de traitement de texte

Pour créer et exécuter avec succès l'exemple de code de ce didacticiel, nous aurons besoin d'un environnement configuré qui contiendra à la fois un python à usage général ainsi que les packages spéciaux requis pour la science des données. Nous examinerons d'abord l'installation du python à usage général qui peut être python 2 ou python 3. Mais nous préférerons python 2 pour ce tutoriel principalement en raison de sa maturité et de son support plus large des packages externes.

Obtenir Python

Le code source, les binaires, la documentation, les actualités, etc. les plus à jour et les plus récents sont disponibles sur le site officiel de Python https://www.python.org/

Vous pouvez télécharger la documentation Python depuis https://www.python.org/doc/. La documentation est disponible aux formats HTML, PDF et PostScript.

Installer Python

La distribution Python est disponible pour une grande variété de plates-formes. Vous devez télécharger uniquement le code binaire applicable à votre plateforme et installer Python.

Si le code binaire de votre plateforme n'est pas disponible, vous avez besoin d'un compilateur C pour compiler le code source manuellement. La compilation du code source offre plus de flexibilité en termes de choix des fonctionnalités dont vous avez besoin dans votre installation.

Voici un bref aperçu de l'installation de Python sur différentes plates-formes -

Installation Unix et Linux

Voici les étapes simples pour installer Python sur une machine Unix / Linux.

  • Ouvrez un navigateur Web et accédez à https://www.python.org/downloads/.

  • Suivez le lien pour télécharger le code source compressé disponible pour Unix / Linux.

  • Téléchargez et extrayez des fichiers.

  • Modification du fichier Modules / Setup si vous souhaitez personnaliser certaines options.

  • exécuter le script ./configure

  • make

  • faire installer

Cela installe Python à l'emplacement standard / usr / local / bin et ses bibliothèques dans / usr / local / lib / pythonXX où XX est la version de Python.

Installation de Windows

Voici les étapes pour installer Python sur une machine Windows.

  • Ouvrez un navigateur Web et accédez à https://www.python.org/downloads/.

  • Suivez le lien pour le fichier d' installation de Windows python-XYZ.msi où XYZ est la version que vous devez installer.

  • Pour utiliser ce programme d'installation python-XYZ.msi , le système Windows doit prendre en charge Microsoft Installer 2.0. Enregistrez le fichier du programme d'installation sur votre ordinateur local, puis exécutez-le pour savoir si votre ordinateur prend en charge MSI.

  • Exécutez le fichier téléchargé. Cela fait apparaître l'assistant d'installation Python, qui est vraiment facile à utiliser. Acceptez simplement les paramètres par défaut, attendez que l'installation soit terminée et vous avez terminé.

Installation sur Macintosh

Les Mac récents sont livrés avec Python installé, mais il peut être obsolète de plusieurs années. Voirhttp://www.python.org/download/mac/pour obtenir des instructions sur l'obtention de la version actuelle ainsi que des outils supplémentaires pour prendre en charge le développement sur Mac. Pour les Mac OS plus anciens avant Mac OS X 10.3 (publié en 2003), MacPython est disponible.

Jack Jansen le maintient et vous pouvez avoir un accès complet à toute la documentation sur son site Web - http://www.cwi.nl/~jack/macpython.html. Vous pouvez trouver les détails d'installation complets pour l'installation de Mac OS.

Configurer PATH

Les programmes et autres fichiers exécutables peuvent se trouver dans de nombreux répertoires, de sorte que les systèmes d'exploitation fournissent un chemin de recherche qui répertorie les répertoires dans lesquels le système d'exploitation recherche les exécutables.

Le chemin est stocké dans une variable d'environnement, qui est une chaîne nommée gérée par le système d'exploitation. Cette variable contient des informations disponibles pour le shell de commande et d'autres programmes.

le path La variable est nommée PATH sous Unix ou Path sous Windows (Unix est sensible à la casse; Windows ne l'est pas).

Sous Mac OS, le programme d'installation gère les détails du chemin. Pour appeler l'interpréteur Python à partir d'un répertoire particulier, vous devez ajouter le répertoire Python à votre chemin.

Définition du chemin sous Unix / Linux

Pour ajouter le répertoire Python au chemin d'une session particulière sous Unix -

  • In the csh shell - tapez setenv PATH "$ PATH: / usr / local / bin / python" et appuyez sur Entrée.

  • In the bash shell (Linux) - tapez export ATH = "$ PATH: / usr / local / bin / python" et appuyez sur Entrée.

  • In the sh or ksh shell - tapez PATH = "$ PATH: / usr / local / bin / python" et appuyez sur Entrée.

  • Note - / usr / local / bin / python est le chemin du répertoire Python

Définition du chemin sous Windows

Pour ajouter le répertoire Python au chemin d'une session particulière dans Windows -

At the command prompt - tapez path% path%; C: \ Python et appuyez sur Entrée.

Note - C: \ Python est le chemin du répertoire Python

Variables d'environnement Python

Voici des variables d'environnement importantes, qui peuvent être reconnues par Python -

Sr.No. Variable et description
1

PYTHONPATH

Il a un rôle similaire à PATH. Cette variable indique à l'interpréteur Python où localiser les fichiers de module importés dans un programme. Il doit inclure le répertoire de la bibliothèque source Python et les répertoires contenant le code source Python. PYTHONPATH est parfois prédéfini par le programme d'installation Python.

2

PYTHONSTARTUP

Il contient le chemin d'un fichier d'initialisation contenant le code source Python. Il est exécuté chaque fois que vous démarrez l'interpréteur. Il est nommé .pythonrc.py sous Unix et contient des commandes qui chargent des utilitaires ou modifient PYTHONPATH.

3

PYTHONCASEOK

Il est utilisé dans Windows pour demander à Python de trouver la première correspondance insensible à la casse dans une instruction d'importation. Définissez cette variable sur n'importe quelle valeur pour l'activer.

4

PYTHONHOME

C'est un chemin de recherche de module alternatif. Il est généralement intégré dans les répertoires PYTHONSTARTUP ou PYTHONPATH pour faciliter le changement de bibliothèques de modules.

Exécuter Python

Il existe trois façons différentes de démarrer Python -

Interprète interactif

Vous pouvez démarrer Python à partir d'Unix, de DOS ou de tout autre système qui vous fournit un interpréteur de ligne de commande ou une fenêtre shell.

Entrer python la ligne de commande.

Commencez immédiatement à coder dans l'interpréteur interactif.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

Voici la liste de toutes les options de ligne de commande disponibles -

Sr.No. Option et description
1

-d

Il fournit une sortie de débogage.

2

-O

Il génère un bytecode optimisé (résultant en des fichiers .pyo).

3

-S

N'exécutez pas le site d'importation pour rechercher les chemins Python au démarrage.

4

-v

sortie verbeuse (trace détaillée sur les instructions d'importation).

5

-X

désactiver les exceptions intégrées basées sur les classes (utilisez simplement des chaînes); obsolète à partir de la version 1.6.

6

-c cmd

exécuter le script Python envoyé en tant que chaîne cmd

sept

file

exécuter un script Python à partir d'un fichier donné

Script depuis la ligne de commande

Un script Python peut être exécuté en ligne de commande en appelant l'interpréteur sur votre application, comme dans ce qui suit -

$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or 
C: >python script.py # Windows/DOS

Note - Assurez-vous que le mode d'autorisation de fichier permet l'exécution.

Environnement de développement intégré

Vous pouvez également exécuter Python à partir d'un environnement d'interface utilisateur graphique (GUI), si vous avez une application GUI sur votre système qui prend en charge Python.

  • Unix - IDLE est le tout premier IDE Unix pour Python.

  • Windows - PythonWin est la première interface Windows pour Python et est un IDE avec une interface graphique.

  • Macintosh - La version Macintosh de Python avec l'IDE IDLE est disponible sur le site principal, téléchargeable sous forme de fichiers MacBinary ou BinHex'd.

Installation du pack NLTK

NLTK est très simple à intégrer dans l'environnement python. Utilisez la commande ci-dessous pour ajouter NLTK à l'environnement.

sudo pip install -U nltk

L'ajout d'autres bibliothèques sera discuté dans chaque chapitre au fur et à mesure que nous en aurons besoin pour leur utilisation dans le programme python.