OpenNLP - Übersicht

NLP ist eine Reihe von Tools, mit denen aussagekräftige und nützliche Informationen aus Quellen in natürlicher Sprache wie Webseiten und Textdokumenten abgeleitet werden können.

Was ist Open NLP?

Apache OpenNLPist eine Open-Source-Java-Bibliothek, mit der Text in natürlicher Sprache verarbeitet wird. Mit dieser Bibliothek können Sie einen effizienten Textverarbeitungsdienst erstellen.

OpenNLP bietet Dienste wie Tokenisierung, Satzsegmentierung, Tag-of-Speech-Tagging, Extraktion benannter Entitäten, Chunking, Parsing und Co-Referenz-Auflösung usw. an.

Funktionen von OpenNLP

Im Folgenden sind die bemerkenswerten Funktionen von OpenNLP aufgeführt:

  • Named Entity Recognition (NER) - Open NLP unterstützt NER, mit dem Sie Namen von Orten, Personen und Dingen auch während der Verarbeitung von Abfragen extrahieren können.

  • Summarize - Verwenden der summarize Mit dieser Funktion können Sie Absätze, Artikel, Dokumente oder deren Sammlung in NLP zusammenfassen.

  • Searching - In OpenNLP können eine bestimmte Suchzeichenfolge oder ihre Synonyme in einem bestimmten Text identifiziert werden, obwohl das angegebene Wort geändert oder falsch geschrieben wurde.

  • Tagging (POS) - Das Markieren in NLP wird verwendet, um den Text zur weiteren Analyse in verschiedene grammatikalische Elemente zu unterteilen.

  • Translation - In NLP hilft die Übersetzung beim Übersetzen einer Sprache in eine andere.

  • Information grouping - Diese Option in NLP gruppiert die Textinformationen im Inhalt des Dokuments, genau wie Wortarten.

  • Natural Language Generation - Es wird zum Generieren von Informationen aus einer Datenbank und zum Automatisieren von Informationsberichten wie Wetteranalysen oder medizinischen Berichten verwendet.

  • Feedback Analysis - Wie der Name schon sagt, sammelt NLP verschiedene Arten von Rückmeldungen von Personen zu den Produkten, um zu analysieren, wie gut das Produkt erfolgreich sein Herz erobert.

  • Speech recognition - Obwohl es schwierig ist, die menschliche Sprache zu analysieren, verfügt NLP über einige integrierte Funktionen für diese Anforderung.

Öffnen Sie die NLP-API

Die Apache OpenNLP-Bibliothek bietet Klassen und Schnittstellen, mit denen verschiedene Aufgaben der Verarbeitung natürlicher Sprache ausgeführt werden können, z. B. Satzerkennung, Tokenisierung, Suchen eines Namens, Markieren der Wortteile, Aufteilen eines Satzes, Parsen, Auflösung von Co-Referenzen und Kategorisieren von Dokumenten.

Zusätzlich zu diesen Aufgaben können wir auch unsere eigenen Modelle für jede dieser Aufgaben trainieren und bewerten.

OpenNLP CLI

Neben der Bibliothek bietet OpenNLP auch eine Befehlszeilenschnittstelle (Command Line Interface, CLI), über die wir Modelle trainieren und bewerten können. Wir werden dieses Thema im letzten Kapitel dieses Tutorials ausführlich behandeln.

Öffnen Sie NLP-Modelle

Um verschiedene NLP-Aufgaben auszuführen, bietet OpenNLP eine Reihe vordefinierter Modelle. Dieses Set enthält Modelle für verschiedene Sprachen.

Modelle herunterladen

Sie können die folgenden Schritte ausführen, um die von OpenNLP bereitgestellten vordefinierten Modelle herunterzuladen.

Step 1 - Öffnen Sie die Indexseite von OpenNLP-Modellen, indem Sie auf den folgenden Link klicken - http://opennlp.sourceforge.net/models-1.5/.

Step 2- Wenn Sie den angegebenen Link besuchen, sehen Sie eine Liste der Komponenten verschiedener Sprachen und die Links zum Herunterladen. Hier erhalten Sie eine Liste aller von OpenNLP bereitgestellten vordefinierten Modelle.

Laden Sie alle diese Modelle in den Ordner herunter C:/OpenNLP_models/>, indem Sie auf die entsprechenden Links klicken. Alle diese Modelle sind sprachabhängig. Während Sie diese verwenden, müssen Sie sicherstellen, dass die Modellsprache mit der Sprache des Eingabetextes übereinstimmt.

Geschichte von OpenNLP

  • Im Jahr 2010 trat OpenNLP in die Apache-Inkubation ein.

  • Im Jahr 2011 wurde Apache OpenNLP 1.5.2 Incubating veröffentlicht und im selben Jahr als Apache-Projekt der obersten Ebene abgeschlossen.

  • Im Jahr 2015 wurde OpenNLP 1.6.0 veröffentlicht.