Gensim Tutorial
Gensim = “Generate Similar”to popularna biblioteka przetwarzania języka naturalnego o otwartym kodzie źródłowym, używana do modelowania tematów bez nadzoru. Wykorzystuje najlepsze modele akademickie i nowoczesne statystyczne uczenie maszynowe do wykonywania różnych złożonych zadań, takich jak tworzenie dokumentów lub wektorów słów, korpusów, identyfikacja tematów, porównywanie dokumentów (wyszukiwanie dokumentów podobnych semantycznie), analizowanie dokumentów tekstowych pod kątem struktury semantycznej.
Ten samouczek będzie przydatny dla absolwentów, absolwentów studiów podyplomowych i studentów, którzy są zainteresowani przetwarzaniem języka naturalnego (NLP), modelowaniem tematycznym lub mają te przedmioty jako część ich programu nauczania. Czytelnik może być początkującym lub zaawansowanym uczniem.
Czytelnik musi mieć podstawową wiedzę na temat NLP, a także powinien być świadomy koncepcji programowania w Pythonie.