OpenNLP - Genel Bakış

NLP, web sayfaları ve metin belgeleri gibi doğal dil kaynaklarından anlamlı ve faydalı bilgiler elde etmek için kullanılan bir dizi araçtır.

Açık NLP nedir?

Apaçi OpenNLPdoğal dil metnini işlemek için kullanılan açık kaynaklı bir Java kitaplığıdır. Bu kitaplığı kullanarak verimli bir metin işleme hizmeti oluşturabilirsiniz.

OpenNLP, belirteçleme, cümle bölümleme, konuşma parçası etiketleme, adlandırılmış varlık çıkarma, parçalama, ayrıştırma ve ortak referans çözümleme gibi hizmetler sağlar.

OpenNLP'nin Özellikleri

OpenNLP'nin dikkate değer özellikleri şunlardır -

  • Named Entity Recognition (NER) - Açık NLP, sorguları işlerken bile konumların, kişilerin ve şeylerin adlarını çıkarabileceğiniz NER'i destekler.

  • Summarize - Kullanmak summarize özelliği, Paragrafları, makaleleri, belgeleri veya bunların koleksiyonunu NLP'de özetleyebilirsiniz.

  • Searching - OpenNLP'de, belirli bir arama dizesi veya eşanlamlıları, verilen kelime değiştirilmiş veya yanlış yazılmış olsa bile, verilen metinde tanımlanabilir.

  • Tagging (POS) - NLP'de etiketleme, metni daha fazla analiz için çeşitli dilbilgisi öğelerine bölmek için kullanılır.

  • Translation - Çeviri, NLP'de bir dilin diğerine çevrilmesine yardımcı olur.

  • Information grouping - NLP'deki bu seçenek, tıpkı konuşmanın bölümleri gibi, belge içeriğindeki metin bilgilerini gruplandırır.

  • Natural Language Generation - Bir veri tabanından bilgi üretmek ve hava durumu analizi veya tıbbi raporlar gibi bilgi raporlarını otomatikleştirmek için kullanılır.

  • Feedback Analysis - Adından da anlaşılacağı gibi, NLP tarafından ürünlerin kalplerini kazanmada ne kadar başarılı olduğunu analiz etmek için insanlardan ürünlerle ilgili çeşitli geri bildirimler toplanır.

  • Speech recognition - İnsan konuşmasını analiz etmek zor olsa da, NLP bu gereksinim için bazı yerleşik özelliklere sahiptir.

NLP API'sini aç

Apache OpenNLP kitaplığı, cümle algılama, belirteçleştirme, bir ad bulma, konuşma bölümlerini etiketleme, bir cümleyi parçalama, ayrıştırma, ortak referans çözümleme ve belge kategorizasyonu gibi çeşitli doğal dil işleme görevlerini gerçekleştirmek için sınıflar ve arayüzler sağlar.

Bu görevlere ek olarak, bu görevlerden herhangi biri için kendi modellerimizi de eğitebilir ve değerlendirebiliriz.

OpenNLP CLI

OpenNLP, kütüphaneye ek olarak, modelleri eğitip değerlendirebileceğimiz bir Komut Satırı Arayüzü (CLI) de sağlar. Bu eğitimin son bölümünde bu konuyu ayrıntılı olarak tartışacağız.

Açık NLP Modelleri

OpenNLP, çeşitli NLP görevlerini gerçekleştirmek için önceden tanımlanmış bir dizi model sağlar. Bu set, farklı diller için modeller içerir.

Modelleri indirmek

OpenNLP tarafından sağlanan önceden tanımlanmış modelleri indirmek için aşağıda verilen adımları takip edebilirsiniz.

Step 1 - Aşağıdaki bağlantıya tıklayarak OpenNLP modellerinin dizin sayfasını açın - http://opennlp.sourceforge.net/models-1.5/.

Step 2- Verilen bağlantıyı ziyaret ettiğinizde, çeşitli dillerdeki bileşenlerin bir listesini ve bunları indirmek için bağlantıları göreceksiniz. Burada, OpenNLP tarafından sağlanan tüm önceden tanımlanmış modellerin listesini alabilirsiniz.

Tüm bu modelleri klasöre indirin C:/OpenNLP_models/>, ilgili bağlantılara tıklayarak. Tüm bu modeller dile bağlıdır ve bunları kullanırken model dilinin giriş metninin diliyle eşleştiğinden emin olmalısınız.

OpenNLP Tarihçesi

  • 2010 yılında OpenNLP, Apache inkübasyonuna girdi.

  • 2011 yılında Apache OpenNLP 1.5.2 Incubating piyasaya sürüldü ve aynı yıl üst düzey Apache projesi olarak mezun oldu.

  • 2015 yılında OpenNLP 1.6.0 yayınlandı.