Tutorial de Gensim
Gensim = “Generate Similar”es una popular biblioteca de procesamiento de lenguaje natural de código abierto que se utiliza para el modelado de temas sin supervisión. Utiliza los mejores modelos académicos y el aprendizaje automático estadístico moderno para realizar diversas tareas complejas, como la construcción de vectores de documentos o palabras, corpora, realizar la identificación de temas, realizar la comparación de documentos (recuperar documentos semánticamente similares), analizar documentos de texto sin formato para la estructura semántica.
Este tutorial será útil para graduados, posgraduados y estudiantes de investigación que tengan interés en el procesamiento del lenguaje natural (PNL), el modelado de temas o que tengan estas materias como parte de su plan de estudios. El lector puede ser principiante o avanzado.
El lector debe tener conocimientos básicos sobre PNL y también debe conocer los conceptos de programación de Python.