Python - ambiente de processamento de texto
Para criar e executar com sucesso o código de exemplo neste tutorial, precisaremos de um ambiente configurado que terá tanto o python de uso geral quanto os pacotes especiais necessários para ciência de dados. Primeiro veremos como instalar o python de uso geral, que pode ser python 2 ou python 3. Mas preferiremos o python 2 para este tutorial principalmente por causa de sua maturidade e suporte mais amplo de pacotes externos.
Obtendo Python
O código-fonte mais atualizado e atual, binários, documentação, notícias, etc., está disponível no site oficial do Python https://www.python.org/
Você pode baixar a documentação do Python em https://www.python.org/doc/. A documentação está disponível nos formatos HTML, PDF e PostScript.
Instalando Python
A distribuição Python está disponível para uma ampla variedade de plataformas. Você precisa baixar apenas o código binário aplicável à sua plataforma e instalar o Python.
Se o código binário para sua plataforma não estiver disponível, você precisa de um compilador C para compilar o código-fonte manualmente. Compilar o código-fonte oferece mais flexibilidade em termos de escolha de recursos que você precisa em sua instalação.
Aqui está uma rápida visão geral da instalação do Python em várias plataformas -
Instalação Unix e Linux
Aqui estão as etapas simples para instalar o Python em uma máquina Unix / Linux.
Abra um navegador da Web e vá para https://www.python.org/downloads/.
Siga o link para baixar o código-fonte compactado disponível para Unix / Linux.
Baixe e extraia arquivos.
Editando o arquivo Módulos / Configuração se desejar personalizar algumas opções.
execute o script ./configure
make
faça instalar
Isso instala o Python no local padrão / usr / local / bin e suas bibliotecas em / usr / local / lib / pythonXX onde XX é a versão do Python.
Instalação Windows
Aqui estão as etapas para instalar o Python na máquina Windows.
Abra um navegador da Web e vá para https://www.python.org/downloads/.
Siga o link para o arquivo python-XYZ.msi do instalador do Windows, em que XYZ é a versão que você precisa instalar.
Para usar este instalador python-XYZ.msi , o sistema Windows deve oferecer suporte ao Microsoft Installer 2.0. Salve o arquivo do instalador em sua máquina local e execute-o para descobrir se sua máquina oferece suporte a MSI.
Execute o arquivo baixado. Isso abre o assistente de instalação do Python, que é realmente fácil de usar. Basta aceitar as configurações padrão e esperar até que a instalação seja concluída e você esteja pronto.
Instalação Macintosh
Macs recentes vêm com o Python instalado, mas pode estar desatualizado há vários anos. Vejohttp://www.python.org/download/mac/para obter instruções sobre como obter a versão atual junto com ferramentas extras para apoiar o desenvolvimento no Mac. Para Mac OS anteriores ao Mac OS X 10.3 (lançado em 2003), o MacPython está disponível.
Jack Jansen o mantém e você pode ter acesso total a toda a documentação em seu site - http://www.cwi.nl/~jack/macpython.html. Você pode encontrar detalhes de instalação completos para a instalação do Mac OS.
Configurando PATH
Os programas e outros arquivos executáveis podem estar em vários diretórios, portanto, os sistemas operacionais fornecem um caminho de pesquisa que lista os diretórios em que o sistema operacional pesquisa executáveis.
O caminho é armazenado em uma variável de ambiente, que é uma string nomeada mantida pelo sistema operacional. Esta variável contém informações disponíveis para o shell de comando e outros programas.
o path variável é nomeada como PATH no Unix ou Path no Windows (Unix diferencia maiúsculas de minúsculas; Windows não).
No Mac OS, o instalador lida com os detalhes do caminho. Para invocar o interpretador Python de qualquer diretório específico, você deve adicionar o diretório Python ao seu caminho.
Definir caminho em Unix / Linux
Para adicionar o diretório Python ao caminho para uma sessão particular no Unix -
In the csh shell - digite setenv PATH "$ PATH: / usr / local / bin / python" e pressione Enter.
In the bash shell (Linux) - digite export ATH = "$ PATH: / usr / local / bin / python" e pressione Enter.
In the sh or ksh shell - digite PATH = "$ PATH: / usr / local / bin / python" e pressione Enter.
Note - / usr / local / bin / python é o caminho do diretório Python
Configurando caminho no Windows
Para adicionar o diretório Python ao caminho para uma sessão específica no Windows -
At the command prompt - digite path% path%; C: \ Python e pressione Enter.
Note - C: \ Python é o caminho do diretório Python
Variáveis de ambiente Python
Aqui estão variáveis de ambiente importantes, que podem ser reconhecidas pelo Python -
Sr. Não. | Variável e Descrição |
---|---|
1 | PYTHONPATH Ele tem uma função semelhante a PATH. Esta variável informa ao interpretador Python onde localizar os arquivos de módulo importados para um programa. Deve incluir o diretório da biblioteca de origem do Python e os diretórios que contêm o código-fonte do Python. PYTHONPATH às vezes é predefinido pelo instalador Python. |
2 | PYTHONSTARTUP Ele contém o caminho de um arquivo de inicialização contendo o código-fonte Python. Ele é executado toda vez que você inicia o interpretador. É denominado .pythonrc.py no Unix e contém comandos que carregam utilitários ou modificam PYTHONPATH. |
3 | PYTHONCASEOK É usado no Windows para instruir o Python a encontrar a primeira correspondência sem distinção entre maiúsculas e minúsculas em uma instrução de importação. Defina esta variável com qualquer valor para ativá-la. |
4 | PYTHONHOME É um caminho alternativo de pesquisa de módulo. Geralmente é incorporado aos diretórios PYTHONSTARTUP ou PYTHONPATH para facilitar a troca de bibliotecas de módulos. |
Executando Python
Existem três maneiras diferentes de iniciar o Python -
Intérprete Interativo
Você pode iniciar o Python a partir do Unix, DOS ou qualquer outro sistema que forneça um interpretador de linha de comando ou janela de shell.
Entrar python a linha de comando.
Comece a codificar imediatamente no interpretador interativo.
$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS
Aqui está a lista de todas as opções de linha de comando disponíveis -
Sr. Não. | Opção e descrição |
---|---|
1 | -d Ele fornece saída de depuração. |
2 | -O Ele gera bytecode otimizado (resultando em arquivos .pyo). |
3 | -S Não execute o site de importação para procurar caminhos Python na inicialização. |
4 | -v saída detalhada (rastreamento detalhado nas instruções de importação). |
5 | -X desabilite exceções integradas baseadas em classe (apenas use strings); obsoleto a partir da versão 1.6. |
6 | -c cmd execute o script Python enviado como string cmd |
7 | file execute o script Python a partir do arquivo fornecido |
Script da linha de comando
Um script Python pode ser executado na linha de comando invocando o interpretador em seu aplicativo, como a seguir -
$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or
C: >python script.py # Windows/DOS
Note - Certifique-se de que o modo de permissão de arquivo permite a execução.
Ambiente de desenvolvimento integrado
Você também pode executar o Python a partir de um ambiente de interface gráfica do usuário (GUI), se tiver um aplicativo GUI em seu sistema que suporte Python.
Unix - IDLE é o primeiro IDE Unix para Python.
Windows - PythonWin é a primeira interface Windows para Python e é um IDE com uma GUI.
Macintosh - A versão para Macintosh do Python junto com o IDLE IDE está disponível no site principal, para download como arquivos MacBinary ou BinHex.
Instalando o Pacote NLTK
O NLTK é muito simples de se integrar ao ambiente python. Use o comando abaixo para adicionar NLTK ao ambiente.
sudo pip install -U nltk
A adição de outras bibliotecas será discutida em cada capítulo conforme e quando precisarmos para seu uso no programa python.