Doğal Dil İşleme - Başlangıç
Bu bölümde, Doğal Dil İşlemede doğal dil başlangıcını tartışacağız. Başlangıç olarak, önce Natural Language Grammar'ın ne olduğunu anlayalım.
Doğal Dil Dilbilgisi
Dilbilim için dil, bir grup rastgele ses işaretidir. Dilin yaratıcı, kurallarla yönetildiğini, aynı zamanda doğuştan ve evrensel olduğunu söyleyebiliriz. Öte yandan, insanca da. Dilin doğası farklı insanlar için farklıdır. Dilin doğası hakkında birçok yanlış anlama var. Bu nedenle belirsiz terimin anlamını anlamak çok önemlidir.‘grammar’. Dilbilimde gramer terimi, hangi dilin çalıştığı ile ilgili kurallar veya ilkeler olarak tanımlanabilir. Geniş anlamda, dilbilgisini iki kategoriye ayırabiliriz -
Tanımlayıcı Dilbilgisi
Dilbilim ve dilbilgisi uzmanlarının konuşmacının dilbilgisini formüle ettiği kurallar kümesine açıklayıcı dilbilgisi denir.
Perspektif Dilbilgisi
Dilde bir doğruluk standardı sağlamaya çalışan çok farklı bir dilbilgisi anlayışıdır. Bu kategorinin dilin gerçek işleyişiyle pek ilgisi yoktur.
Dil Bileşenleri
Çalışma dili, geleneksel ve aynı zamanda dilbilimsel araştırmanın keyfi bölümleri olan birbiriyle ilişkili bileşenlere bölünmüştür. Bu bileşenlerin açıklaması aşağıdaki gibidir -
Fonoloji
Dilin ilk bileşeni sesbilimdir. Belirli bir dilin konuşma seslerinin incelenmesidir. Sözcüğün kökeni, "telefon" un ses veya ses anlamına geldiği Yunanca diline kadar izlenebilir. Fonolojinin bir alt bölümü olan fonetik, insan dilinin konuşma seslerinin üretimi, algısı veya fiziksel özellikleri açısından incelenmesidir. IPA (Uluslararası Fonetik Alfabe), fonoloji okurken insan seslerini düzenli bir şekilde temsil eden bir araçtır. IPA'da her yazılı sembol bir ve yalnızca bir konuşma sesini temsil eder ve bunun tersi de geçerlidir.
Sesbirimler
Bir dilde bir kelimeyi diğerinden ayıran ses birimlerinden biri olarak tanımlanabilir. Dilbilimde, ses birimleri eğik çizgiler arasında yazılır. Örneğin, fonem/k/ kit, skeç gibi kelimelerde oluşur.
Morfoloji
Dilin ikinci bileşenidir. Belirli bir dildeki kelimelerin yapısı ve sınıflandırılmasıyla ilgili çalışmadır. Sözcüğün kökeni, 'morphe' kelimesinin 'biçim' anlamına geldiği Yunanca dilindendir. Morfoloji, bir dilde kelimelerin oluşum ilkelerini ele alır. Başka bir deyişle, seslerin önekler, son ekler ve kökler gibi anlamlı birimler halinde nasıl birleştiği. Ayrıca, kelimelerin nasıl konuşma bölümlerine ayrılabileceğini de değerlendirir.
Lexeme
Dilbilimde, tek bir kelime tarafından alınan bir dizi forma karşılık gelen soyut morfolojik analiz birimine sözcükbirim denir. Bir sözcükbiriminin bir cümlede kullanılma şekli dilbilgisi kategorisine göre belirlenir. Lexeme, tek kelime veya çoklu kelime olabilir. Örneğin, konuşma kelimesi, konuşma, konuşma ve konuşma gibi birçok gramer varyantına sahip olabilen tek bir kelime sözlüğü örneğidir. Çok kelimeli sözlük, birden fazla ortografik kelimeden oluşabilir. Örneğin, konuşun, içeri çekin, vb. Çok kelimeli sözlüklere örnektir.
Sözdizimi
Dilin üçüncü bileşenidir. Kelimelerin sırasının ve daha büyük birimlere düzenlenmesinin incelenmesidir. Kelime, suntassein kelimesinin 'sıraya koymak' anlamına geldiği Yunanca diline kadar izlenebilir. Cümle türlerini ve yapılarını, cümleciklerin ve cümlelerin yapılarını inceler.
Anlambilim
Dilin dördüncü bileşenidir. Anlamın nasıl aktarıldığının incelenmesidir. Anlam, dış dünya ile ilgili olabilir veya cümlenin dilbilgisi ile ilgili olabilir. Kelime, semainein kelimesinin 'belirtmek', 'göstermek', 'sinyal' anlamına geldiği Yunanca diline kadar izlenebilir.
Edimbilim
Dilin beşinci bileşenidir. Dilin işlevlerinin ve bağlam içinde kullanımının incelenmesidir. Sözcüğün kökeni, 'pragma' kelimesinin 'eylem', 'ilişki' anlamına geldiği Yunanca diline kadar izlenebilir.
Dilbilgisel Kategoriler
Bir dilbilgisi kategorisi, bir dilin grameri içindeki bir birim veya özellik sınıfı olarak tanımlanabilir. Bu birimler dilin yapı taşlarıdır ve ortak bir özellik kümesini paylaşır. Dilbilgisi kategorilerine gramer özellikleri de denir.
Dilbilgisi kategorilerinin envanteri aşağıda açıklanmıştır -
Numara
En basit gramer kategorisidir. Bu kategori ile ilgili tekil ve çoğul olmak üzere iki terimimiz var. Tekil, 'bir' kavramıdır, çoğul ise 'birden fazla' kavramıdır. Örneğin, köpek / köpekler, bu / bunlar.
Cinsiyet
Dilbilgisel cinsiyet, şahıs zamirleri ve 3. şahıslardaki çeşitlilikle ifade edilir. Dilbilgisel cinsiyet örnekleri tekildir - o, o, o; birinci ve ikinci kişi formları - ben, biz ve siz; 3. kişi çoğul halleri, ya ortak cinsiyet ya da nötr cinsiyettir.
Kişi
Bir başka basit gramer kategorisi de kişidir. Bunun altında, aşağıdaki üç terim tanınır -
1st person - Konuşan kişi 1. kişi olarak kabul edilir.
2nd person - Dinleyen veya konuşulan kişi 2. kişi olarak kabul edilir.
3rd person - Hakkında konuştuğumuz kişi veya şey 3. kişi olarak kabul edilir.
Durum
En zor gramer kategorilerinden biridir. Bir isim cümlesinin (NP) işlevinin veya bir isim cümlesinin bir fiil veya cümledeki diğer isim cümleleri ile olan ilişkisinin bir göstergesi olarak tanımlanabilir. Kişisel ve soru zamirlerinde ifade edilen aşağıdaki üç durum var:
Nominative case- Öznenin işlevidir. Örneğin ben, biz, sen, o, o, o, onlar ve kimler aday.
Genitive case- Mülk sahibinin işlevidir. Örneğin, benim / benim, bizim / bizim, onun, onun / onun, onun, onların / onların, soysal olanlar.
Objective case- Nesnenin işlevidir. Mesela ben, biz, sen, o, o, onlar, objektif olanlar.
Derece
Bu gramer kategorisi sıfatlar ve zarflarla ilgilidir. Aşağıdaki üç terime sahiptir -
Positive degree- Bir kaliteyi ifade eder. Örneğin, büyük, hızlı, güzel pozitif derecelerdir.
Comparative degree- İki maddeden birinde kalitenin daha yüksek derecesini veya yoğunluğunu ifade eder. Örneğin, daha büyük, daha hızlı, daha güzel karşılaştırmalı derecelerdir.
Superlative degree- Üç veya daha fazla öğeden birinde kalitenin en büyük derecesini veya yoğunluğunu ifade eder. Örneğin, en büyük, en hızlı, en güzel, en üstün derecelerdir.
Kesinlik ve Belirsizlik
Bu iki kavram da çok basit. Bildiğimiz şekliyle kesinlik, konuşmacı veya işiten tarafından bilinen, tanıdık veya tanımlanabilen bir referansı temsil eder. Öte yandan belirsizlik, bilinmeyen veya alışılmadık bir referansı temsil eder. Kavram, bir makalenin bir isimle birlikte ortaya çıkmasıyla anlaşılabilir -
definite article-
indefinite article- a / an
Gergin
Bu dilbilgisi kategorisi fiille ilgilidir ve bir eylemin zamanının dilsel göstergesi olarak tanımlanabilir. Zaman, konuşma anına göre bir olayın zamanını gösterdiği için bir ilişki kurar. Genel olarak, aşağıdaki üç türdendir -
Present tense- Mevcut anda bir eylemin meydana gelmesini temsil eder. Örneğin, Ram çok çalışıyor.
Past tense- Bir eylemin şimdiki andan önceki halini temsil eder. Örneğin yağmur yağdı.
Future tense- Mevcut andan sonra bir eylemin meydana gelmesini temsil eder. Örneğin yağmur yağacak.
Görünüş
Bu gramer kategorisi, bir olayın bakış açısı olarak tanımlanabilir. Aşağıdaki türlerden olabilir -
Perfective aspect- Görünüm açıdan bir bütün olarak alınır. Örneğin, basit geçmiş zaman gibiyesterday I met my friend, İngilizce, olayı eksiksiz ve bütün olarak gördüğü için mükemmeldir.
Imperfective aspect- Görüş, yön bakımından devam eden ve eksik kabul edilir. Örneğin, şimdiki zaman gibiI am working on this problem, İngilizce konuşması, olayı eksik ve devam eden olarak gördüğü için mükemmel değildir.
Ruh hali
Bu dilbilgisi kategorisini tanımlamak biraz zor ama basitçe konuşmacının ne hakkında konuştuğuna dair tutumunun göstergesi olarak ifade edilebilir. Aynı zamanda fiillerin dilbilgisel özelliğidir. Dilbilgisi zamanlarından ve gramer yönünden farklıdır. Ruh hallerinin örnekleri gösterge niteliğinde, sorgulayıcı, zorunlu, ihtiyatlı, sübjektif, potansiyel, isteğe bağlı, ulaçlar ve katılımcılardır.
Anlaşma
Concord olarak da adlandırılır. Bir kelime, ilişkili olduğu diğer kelimelere bağlı olarak değiştiğinde gerçekleşir. Başka bir deyişle, bazı dilbilgisi kategorilerinin değerinin farklı kelimeler veya konuşmanın bir bölümü arasında uyuşmasını içerir. Diğer dilbilgisi kategorilerine dayalı anlaşmalar aşağıdadır -
Agreement based on Person- Özne ve fiil arasındaki anlaşmadır. Örneğin, biz her zaman "Ben" ve "O" kullanırız, ancak "O" ve "Ben" asla kullanılmaz.
Agreement based on Number- Bu anlaşma özne ve fiil arasındadır. Bu durumda, birinci tekil şahıs, çoğul ikinci şahıs vb. İçin belirli fiil formları vardır. Örneğin, 1. tekil şahıs: Gerçekten ben, 2. şahıs çoğul: Biz gerçekten, 3. şahıs tekiliz: Çocuk şarkı söylüyor, 3. şahıs çoğul: Oğlanlar şarkı söylüyor.
Agreement based on Gender- İngilizcede zamirler ve öncüller arasında cinsiyet konusunda fikir birliği vardır. Örneğin, hedefine ulaştı. Gemi hedefine ulaştı.
Agreement based on Case- Bu tür bir anlaşma İngilizcenin önemli bir özelliği değildir. Örneğin, önce kim geldi - o mu yoksa kız kardeşi mi?
Konuşulan Dil Sözdizimi
Yazılı İngilizce ve sözlü İngilizce dilbilgisi birçok ortak özelliğe sahiptir, ancak bununla birlikte birçok yönden de farklılık gösterirler. Aşağıdaki özellikler, sözlü ve yazılı İngilizce dilbilgisi arasında ayrım yapar -
Eksiklikler ve Onarım
Bu çarpıcı özellik, sözlü ve yazılı İngilizce grameri birbirinden farklı kılar. Bireysel olarak akıntı fenomeni ve toplu olarak onarım fenomeni olarak bilinir. Rahatsızlıklar aşağıdakilerin kullanımını içerir -
Fillers words- Bazen cümle arasında bazı doldurucu kelimeler kullanırız. Bunlara dolgu duraklama dolguları denir. Bu tür kelimelere örnek olarak uh ve um verilebilir.
Reparandum and repair- Cümle arasında tekrarlanan kelime parçasına reparandum denir. Aynı bölümde değiştirilen kelimeye onarım denir. Bunu anlamak için aşağıdaki örneği düşünün -
Does ABC airlines offer any one-way flights uh one-way fares for 5000 rupees?
Yukarıdaki cümlede, tek yön uçuş bir tazminat ve tek yön uçuşlar bir onarımdır.
Yeniden başlatır
Dolgu durduktan sonra yeniden başlatma gerçekleşir. Örneğin, yukarıdaki cümlede, yeniden başlatmalar, konuşmacı tek yön uçuşları sormaya başladığında ve durduğunda, doldurucu duraklatarak kendini düzelttiğinde ve ardından tek yön ücretleri sormaya başladığında gerçekleşir.
Kelime Parçaları
Bazen cümleleri daha küçük kelime parçalarıyla konuşuyoruz. Örneğin,wwha-what is the time? İşte sözler w-wha kelime parçalarıdır.