Python-텍스트 처리 환경

이 자습서에서 예제 코드를 성공적으로 생성하고 실행하려면 범용 Python과 데이터 과학에 필요한 특수 패키지를 모두 포함하는 환경 설정이 필요합니다. 먼저 python 2 또는 python 3이 될 수있는 범용 python을 설치하는 것으로 볼 것입니다. 그러나 우리는 주로 성숙도와 외부 패키지의 광범위한 지원 때문에이 튜토리얼에서 python 2를 선호 할 것입니다.

Python 얻기

최신의 최신 소스 코드, 바이너리, 문서, 뉴스 등은 Python의 공식 웹 사이트에서 확인할 수 있습니다. https://www.python.org/

다음에서 Python 문서를 다운로드 할 수 있습니다. https://www.python.org/doc/. 문서는 HTML, PDF 및 PostScript 형식으로 제공됩니다.

Python 설치

Python 배포는 다양한 플랫폼에서 사용할 수 있습니다. 플랫폼에 적용 할 수있는 바이너리 코드 만 다운로드하고 Python을 설치하면됩니다.

플랫폼의 바이너리 코드를 사용할 수없는 경우 소스 코드를 수동으로 컴파일하려면 C 컴파일러가 필요합니다. 소스 코드를 컴파일하면 설치에 필요한 기능 선택 측면에서 더 많은 유연성을 제공합니다.

다음은 다양한 플랫폼에 Python을 설치하는 간단한 개요입니다.

Unix 및 Linux 설치

다음은 Unix / Linux 컴퓨터에 Python을 설치하는 간단한 단계입니다.

  • 웹 브라우저를 열고 https://www.python.org/downloads/.

  • 링크를 따라 Unix / Linux에 사용할 수있는 압축 된 소스 코드를 다운로드하십시오.

  • 파일을 다운로드하고 추출합니다.

  • 일부 옵션을 사용자 정의 하려면 모듈 / 설정 파일을 편집하십시오 .

  • ./configure 스크립트 실행

  • make

  • 설치하다

그러면 표준 위치 / usr / local / bin에 Python이 설치 되고 / usr / local / lib / pythonXX에 해당 라이브러리가 설치됩니다. 여기서 XX는 Python 버전입니다.

Windows 설치

Windows 컴퓨터에 Python을 설치하는 단계는 다음과 같습니다.

  • 웹 브라우저를 열고 https://www.python.org/downloads/.

  • Windows 설치 프로그램 python-XYZ.msi 파일 의 링크를 따르십시오. 여기서 XYZ는 설치해야하는 버전입니다.

  • 이 설치 프로그램 python-XYZ.msi 를 사용하려면 Windows 시스템이 Microsoft Installer 2.0을 지원해야합니다. 설치 프로그램 파일을 로컬 컴퓨터에 저장 한 다음 실행하여 컴퓨터가 MSI를 지원하는지 확인합니다.

  • 다운로드 한 파일을 실행합니다. 이렇게하면 정말 사용하기 쉬운 Python 설치 마법사가 나타납니다. 기본 설정을 수락하고 설치가 완료 될 때까지 기다리면 완료됩니다.

Macintosh 설치

최근 Mac은 Python이 설치된 상태로 제공되지만 몇 년이 지났을 수 있습니다. 보다http://www.python.org/download/mac/Mac에서 개발을 지원하는 추가 도구와 함께 현재 버전을 얻는 방법에 대한 지침을 참조하십시오. Mac OS X 10.3 (2003 년 출시) 이전의 구형 Mac OS의 경우 MacPython을 사용할 수 있습니다.

Jack Jansen은이를 유지하며 그의 웹 사이트에서 전체 문서에 대한 전체 액세스 권한을 가질 수 있습니다. http://www.cwi.nl/~jack/macpython.html. Mac OS 설치에 대한 전체 설치 세부 정보를 찾을 수 있습니다.

PATH 설정

프로그램 및 기타 실행 파일은 여러 디렉토리에있을 수 있으므로 운영 체제는 OS가 실행 파일을 검색하는 디렉토리를 나열하는 검색 경로를 제공합니다.

경로는 운영 체제에서 유지 관리하는 명명 된 문자열 인 환경 변수에 저장됩니다. 이 변수는 명령 셸 및 기타 프로그램에서 사용할 수있는 정보를 포함합니다.

그만큼 path 변수는 Unix에서 PATH 또는 Windows에서 Path로 이름이 지정됩니다 (Unix는 대소 문자를 구분하고 Windows는 그렇지 않음).

Mac OS에서는 설치 프로그램이 경로 세부 정보를 처리합니다. 특정 디렉터리에서 Python 인터프리터를 호출하려면 Python 디렉터리를 경로에 추가해야합니다.

Unix / Linux에서 경로 설정

유닉스에서 특정 세션의 경로에 파이썬 디렉토리를 추가하려면-

  • In the csh shell − setenv PATH "$ PATH : / usr / local / bin / python"을 입력하고 Enter 키를 누릅니다.

  • In the bash shell (Linux) − export ATH = "$ PATH : / usr / local / bin / python"을 입력하고 Enter 키를 누릅니다.

  • In the sh or ksh shell − PATH = "$ PATH : / usr / local / bin / python"을 입력하고 Enter 키를 누릅니다.

  • Note − / usr / local / bin / python은 Python 디렉토리의 경로입니다.

Windows에서 경로 설정

Windows에서 특정 세션의 경로에 Python 디렉토리를 추가하려면-

At the command prompt − path % path %; C : \ Python을 입력하고 Enter 키를 누릅니다.

Note − C : \ Python은 Python 디렉토리의 경로입니다.

Python 환경 변수

다음은 Python에서 인식 할 수있는 중요한 환경 변수입니다.

Sr. 아니. 변수 및 설명
1

PYTHONPATH

PATH와 유사한 역할을합니다. 이 변수는 프로그램으로 가져온 모듈 파일을 찾을 위치를 Python 인터프리터에 알려줍니다. 여기에는 Python 소스 라이브러리 디렉토리와 Python 소스 코드가 포함 된 디렉토리가 포함되어야합니다. PYTHONPATH는 때때로 Python 설치 프로그램에 의해 사전 설정됩니다.

2

PYTHONSTARTUP

여기에는 Python 소스 코드를 포함하는 초기화 파일의 경로가 포함됩니다. 인터프리터를 시작할 때마다 실행됩니다. Unix에서는 .pythonrc.py로 이름이 지정되며 유틸리티를로드하거나 PYTHONPATH를 수정하는 명령이 포함되어 있습니다.

PYTHONCASEOK

Windows에서 가져 오기 문에서 대소 문자를 구분하지 않는 첫 번째 일치 항목을 찾도록 Python에 지시하는 데 사용됩니다. 이 변수를 활성화하려면 임의의 값으로 설정하십시오.

4

PYTHONHOME

대체 모듈 검색 경로입니다. 일반적으로 모듈 라이브러리를 쉽게 전환 할 수 있도록 PYTHONSTARTUP 또는 PYTHONPATH 디렉토리에 포함됩니다.

Python 실행

Python을 시작하는 방법에는 세 가지가 있습니다.

대화 형 통역사

Unix, DOS 또는 명령 줄 인터프리터 또는 셸 창을 제공하는 다른 시스템에서 Python을 시작할 수 있습니다.

시작하다 python 명령 줄.

대화 형 인터프리터에서 즉시 코딩을 시작하십시오.

$python # Unix/Linux
or
python% # Unix/Linux
or
C:> python # Windows/DOS

다음은 사용 가능한 모든 명령 줄 옵션 목록입니다.

Sr. 아니. 옵션 및 설명
1

-d

디버그 출력을 제공합니다.

2

-O

최적화 된 바이트 코드를 생성합니다 (결과적으로 .pyo 파일).

-S

시작시 Python 경로를 찾기 위해 가져 오기 사이트를 실행하지 마십시오.

4

-v

자세한 출력 (import 문에 대한 자세한 추적).

5

-X

클래스 기반 내장 예외를 비활성화합니다 (문자열 만 사용). 버전 1.6부터 사용되지 않습니다.

6

-c cmd

cmd 문자열로 전송 된 Python 스크립트 실행

7

file

주어진 파일에서 Python 스크립트 실행

명령 줄에서 스크립트

Python 스크립트는 다음과 같이 애플리케이션에서 인터프리터를 호출하여 명령 줄에서 실행할 수 있습니다.

$python script.py # Unix/Linux
or
python% script.py # Unix/Linux
or 
C: >python script.py # Windows/DOS

Note − 파일 권한 모드가 실행을 허용하는지 확인하십시오.

통합 개발 환경

Python을 지원하는 시스템에 GUI 애플리케이션이있는 경우 GUI (그래픽 사용자 인터페이스) 환경에서도 Python을 실행할 수 있습니다.

  • Unix − IDLE은 최초의 Python 용 Unix IDE입니다.

  • Windows − PythonWin은 Python을위한 최초의 Windows 인터페이스이며 GUI가있는 IDE입니다.

  • Macintosh − IDLE IDE와 함께 Python의 Macintosh 버전은 MacBinary 또는 BinHex'd 파일로 다운로드 할 수있는 메인 웹 사이트에서 구할 수 있습니다.

NLTK 팩 설치

NLTK는 파이썬 환경에 통합하는 것이 매우 간단합니다. 아래 명령을 사용하여 NLTK를 환경에 추가하십시오.

sudo pip install -U nltk

다른 라이브러리의 추가는 파이썬 프로그램에서 필요할 때마다 각 장에서 논의 될 것입니다.