Samouczek dotyczący zestawu narzędzi języka naturalnego
Język to metoda komunikacji, za pomocą której możemy mówić, czytać i pisać. Przetwarzanie języka naturalnego (NLP) to dziedzina informatyki, w szczególności sztucznej inteligencji (AI), która zajmuje się umożliwieniem komputerom zrozumienia i przetwarzania ludzkiego języka. Mamy różne narzędzia NLP open source, ale NLTK (Natural Language Toolkit) osiąga bardzo wysokie wyniki, jeśli chodzi o łatwość użycia i wyjaśnienie pojęcia. Krzywa uczenia się Pythona jest bardzo szybka, a NLTK jest napisane w Pythonie, więc NLTK ma również bardzo dobry zestaw do nauki. NLTK włączyło większość zadań, takich jak tokenizacja, wyprowadzanie, lematyzacja, interpunkcja, liczba znaków i liczba słów. Jest bardzo elegancki i łatwy w obsłudze.
Ten samouczek będzie przydatny dla absolwentów, absolwentów studiów podyplomowych i studentów, którzy są zainteresowani NLP lub mają ten przedmiot jako część ich programu nauczania. Czytelnik może być początkującym lub zaawansowanym uczniem.
Czytelnik musi mieć podstawową wiedzę na temat sztucznej inteligencji. Powinien również znać podstawowe terminy używane w gramatyce języka angielskiego i pojęciach programowania w Pythonie.