Natural Language Toolkit-시작하기

NLTK를 설치하려면 컴퓨터에 Python이 설치되어 있어야합니다. www.python.org/downloads 링크로 이동하여 Windows, Mac 및 Linux / Unix와 같은 OS의 최신 버전을 선택할 수 있습니다 . Python에 대한 기본 자습서는 www.tutorialspoint.com/python3/index.htm 링크를 참조 할 수 있습니다 .

이제 컴퓨터 시스템에 Python을 설치했으면 NLTK를 설치하는 방법을 이해하겠습니다.

NLTK 설치

다음과 같이 다양한 OS에 NLTK를 설치할 수 있습니다.

Windows에서

Windows OS에 NLTK를 설치하려면 다음 단계를 따르십시오.

  • 먼저 Windows 명령 프롬프트를 열고 pip 폴더.

  • 다음으로 NLTK를 설치하기 위해 다음 명령을 입력하십시오-

pip3 install nltk

이제 Windows 시작 메뉴에서 PythonShell을 열고 NLTK의 설치를 확인하기 위해 다음 명령을 입력합니다.

Import nltk

오류가 발생하지 않으면 Python3이있는 Windows OS에 NLTK를 성공적으로 설치 한 것입니다.

Mac / Linux에서

Mac / Linux OS에 NLTK를 설치하려면 다음 명령을 작성하십시오.

sudo pip install -U nltk

컴퓨터에 pip가 설치되어 있지 않은 경우 아래 지침에 따라 먼저 설치하십시오. pip

먼저 다음 명령을 사용하여 패키지 색인을 업데이트하십시오.

sudo apt update

이제 다음 명령을 입력하여 설치하십시오. pip 파이썬 3-

sudo apt install python3-pip

아나콘다를 통해

Anaconda를 통해 NLTK를 설치하려면 다음 단계를 따르십시오.

먼저 Anaconda를 설치하려면 www.anaconda.com/distribution/#download-section 링크로 이동 한 다음 설치해야하는 Python 버전을 선택하십시오.

컴퓨터 시스템에 Anaconda가 설치되면 명령 프롬프트로 이동하여 다음 명령을 작성하십시오.

conda install -c anaconda nltk

출력을 검토하고 'yes'를 입력해야합니다. NLTK는 Anaconda 패키지에 다운로드되어 설치됩니다.

NLTK의 데이터 세트 및 패키지 다운로드

이제 컴퓨터에 NLTK가 설치되어 있지만이를 사용하려면 사용 가능한 데이터 세트 (코퍼스)를 다운로드해야합니다. 사용 가능한 몇 가지 중요한 데이터 세트는 다음과 같습니다.stpwords, guntenberg, framenet_v15 등등.

다음 명령의 도움으로 모든 NLTK 데이터 세트를 다운로드 할 수 있습니다.

import nltk
nltk.download()

다음과 같은 NLTK 다운로드 창이 나타납니다.

이제 다운로드 버튼을 클릭하여 데이터 세트를 다운로드합니다.

NLTK 스크립트를 실행하는 방법?

다음은 Porter Stemmer 알고리즘을 사용하여 구현하는 예입니다. PorterStemmernltk 클래스. 이 예제를 통해 NLTK 스크립트를 실행하는 방법을 이해할 수 있습니다.

먼저 자연어 툴킷 (nltk)을 가져와야합니다.

import nltk

이제 PorterStemmer Porter Stemmer 알고리즘을 구현하기위한 클래스.

from nltk.stem import PorterStemmer

다음으로 다음과 같이 Porter Stemmer 클래스의 인스턴스를 만듭니다.

word_stemmer = PorterStemmer()

이제 줄기를 원하는 단어를 입력하십시오. −

word_stemmer.stem('writing')

산출

'write'
word_stemmer.stem('eating')

산출

'eat'