Pemrosesan Bahasa Alami - Awal
Dalam bab ini, kita akan membahas permulaan bahasa alami dalam Pemrosesan Bahasa Alami. Untuk memulainya, pertama-tama mari kita pahami apa itu Tata Bahasa Bahasa Alami.
Tata Bahasa Bahasa Alami
Untuk linguistik, bahasa adalah sekelompok tanda vokal yang berubah-ubah. Kita dapat mengatakan bahwa bahasa itu kreatif, diatur oleh aturan, bawaan serta universal pada saat yang bersamaan. Di sisi lain, itu juga manusiawi. Sifat bahasa berbeda untuk orang yang berbeda. Ada banyak kesalahpahaman tentang sifat bahasa tersebut. Itulah mengapa sangat penting untuk memahami arti dari istilah ambigu tersebut‘grammar’. Dalam linguistik, istilah tata bahasa dapat didefinisikan sebagai aturan atau prinsip dengan bantuan bahasa mana yang berfungsi. Dalam arti luas, kita dapat membagi tata bahasa dalam dua kategori -
Tata Bahasa Deskriptif
Seperangkat aturan, di mana linguistik dan tata bahasa merumuskan tata bahasa pembicara disebut tata bahasa deskriptif.
Tata Bahasa Perspektif
Ini adalah pengertian tata bahasa yang sangat berbeda, yang berusaha mempertahankan standar kebenaran dalam bahasa tersebut. Kategori ini tidak ada hubungannya dengan cara kerja bahasa yang sebenarnya.
Komponen Bahasa
Bahasa studi dibagi menjadi komponen yang saling terkait, yang konvensional serta divisi penyelidikan linguistik yang sewenang-wenang. Penjelasan dari komponen tersebut adalah sebagai berikut -
Fonologi
Komponen pertama bahasa adalah fonologi. Ini adalah studi tentang suara ucapan dari bahasa tertentu. Asal usul kata tersebut dapat ditelusuri ke bahasa Yunani, di mana 'telepon' berarti bunyi atau suara. Fonetik, subdivisi fonologi adalah studi tentang suara ucapan bahasa manusia dari perspektif produksi, persepsi, atau sifat fisiknya. IPA (International Phonetic Alphabet) adalah alat yang merepresentasikan suara manusia secara teratur saat mempelajari fonologi. Dalam IPA, setiap simbol tertulis mewakili satu dan hanya satu suara ucapan dan sebaliknya.
Fonem
Ini dapat didefinisikan sebagai salah satu unit suara yang membedakan satu kata dari kata lain dalam suatu bahasa. Dalam linguistik, fonem ditulis di antara garis miring. Misalnya fonem/k/ terjadi pada kata-kata seperti kit, skit.
Morfologi
Ini adalah komponen bahasa kedua. Ini adalah studi tentang struktur dan klasifikasi kata-kata dalam bahasa tertentu. Asal kata tersebut berasal dari bahasa Yunani, dimana kata 'morphe' berarti 'bentuk'. Morfologi mempertimbangkan prinsip-prinsip pembentukan kata-kata dalam suatu bahasa. Dengan kata lain, bagaimana suara digabungkan menjadi unit yang bermakna seperti prefiks, sufiks, dan akar. Ini juga mempertimbangkan bagaimana kata-kata dapat dikelompokkan menjadi bagian-bagian pidato.
Lexeme
Dalam linguistik, unit abstrak dari analisis morfologi yang berhubungan dengan sekumpulan bentuk yang diambil oleh satu kata disebut lexeme. Cara penggunaan leksem dalam sebuah kalimat ditentukan oleh kategori tata bahasanya. Lexeme bisa menjadi kata individual atau multi kata. Misalnya, kata bicara adalah contoh dari kata leksem individu, yang mungkin memiliki banyak varian tata bahasa seperti berbicara, berbicara dan berbicara. Leksem multiword dapat terdiri dari lebih dari satu kata ortografik. Misalnya, speak up, pull through, dll. Adalah contoh leksem multiword.
Sintaksis
Ini adalah komponen bahasa ketiga. Ini adalah studi tentang urutan dan pengaturan kata-kata menjadi unit yang lebih besar. Kata tersebut dapat ditelusuri ke bahasa Yunani, di mana kata suntassein berarti 'menertibkan'. Ini mempelajari jenis kalimat dan strukturnya, klausa, frasa.
Semantik
Ini adalah komponen bahasa keempat. Ini adalah studi tentang bagaimana makna disampaikan. Makna bisa terkait dengan dunia luar atau bisa terkait dengan tata bahasa kalimat. Kata tersebut dapat ditelusuri ke bahasa Yunani, di mana kata semainein berarti 'menandakan', 'menunjukkan', 'memberi isyarat'.
Pragmatis
Ini adalah komponen bahasa kelima. Ini adalah studi tentang fungsi bahasa dan penggunaannya dalam konteks. Asal usul kata tersebut dapat ditelusuri ke bahasa Yunani di mana kata 'pragma' berarti 'perbuatan', 'perselingkuhan'.
Kategori Tata Bahasa
Kategori tata bahasa dapat didefinisikan sebagai kelas unit atau fitur dalam tata bahasa suatu bahasa. Unit-unit ini adalah blok bangunan bahasa dan berbagi sekumpulan karakteristik yang sama. Kategori tata bahasa juga disebut fitur tata bahasa.
Daftar kategori tata bahasa dijelaskan di bawah ini -
Jumlah
Ini adalah kategori tata bahasa yang paling sederhana. Kami memiliki dua istilah yang terkait dengan kategori ini −singular dan jamak. Singular adalah konsep 'satu' sedangkan, jamak adalah konsep 'lebih dari satu'. Misalnya, anjing / anjing, ini / ini.
Jenis kelamin
Gender gramatikal diekspresikan oleh variasi kata ganti orang dan orang ketiga. Contoh gramatikal jenis kelamin adalah tunggal - he, she, it; bentuk orang pertama dan kedua - saya, kami dan Anda; bentuk jamak orang ke-3 mereka, adalah jenis kelamin umum atau jenis kelamin netral.
Orang
Kategori tata bahasa sederhana lainnya adalah orang. Di bawah ini, tiga istilah berikut diakui -
1st person - Orang yang berbicara dikenali sebagai orang pertama.
2nd person - Orang yang menjadi pendengar atau yang diajak bicara diakui sebagai orang ke-2.
3rd person - Orang atau hal yang kita bicarakan dikenali sebagai orang ketiga.
Kasus
Ini adalah salah satu kategori tata bahasa yang paling sulit. Ini dapat didefinisikan sebagai indikasi fungsi frase kata benda (NP) atau hubungan frase kata benda dengan kata kerja atau dengan frasa kata benda lain dalam kalimat. Kami memiliki tiga kasus berikut yang diekspresikan dalam kata ganti pribadi dan interogatif -
Nominative case- Ini adalah fungsi subjek. Misalnya, saya, kami, Anda, dia, dia, itu, mereka, dan siapa yang nominatif.
Genitive case- Ini adalah fungsi pemilik. Misalnya my / mine, our / ours, his, her / hers, its, their / theirs, yang genitive.
Objective case- Ini adalah fungsi objek. Misalnya, saya, kami, Anda, dia, dia, mereka, yang objektif.
Gelar
Kategori tata bahasa ini terkait dengan kata sifat dan kata keterangan. Ini memiliki tiga istilah berikut -
Positive degree- Ini mengungkapkan kualitas. Misalnya, besar, cepat, indah adalah derajat positif.
Comparative degree- Ini mengungkapkan tingkat atau intensitas kualitas yang lebih besar dalam salah satu dari dua item. Misalnya, lebih besar, lebih cepat, lebih indah adalah derajat komparatif.
Superlative degree- Ini mengungkapkan derajat atau intensitas kualitas terbesar dalam salah satu dari tiga item atau lebih. Misalnya, derajat terbesar, tercepat, terindah adalah derajat superlatif.
Kepastian dan Ketidakpastian
Kedua konsep ini sangat sederhana. Kepastian seperti yang kita ketahui mewakili suatu rujukan, yang diketahui, akrab atau dapat diidentifikasi oleh pembicara atau pendengar. Di sisi lain, ketidaktentuan mewakili rujukan yang tidak diketahui, atau tidak dikenal. Konsep tersebut dapat dipahami dengan terjadinya artikel dengan kata benda -
definite article- itu
indefinite article- a / an
Tegang
Kategori gramatikal ini terkait dengan kata kerja dan dapat didefinisikan sebagai indikasi linguistik waktu suatu tindakan. Tegang membentuk suatu hubungan karena menunjukkan waktu suatu peristiwa sehubungan dengan saat berbicara. Secara umum, ini adalah dari tiga jenis berikut -
Present tense- Mewakili terjadinya suatu tindakan di saat sekarang. Misalnya, Ram bekerja keras.
Past tense- Mewakili terjadinya suatu tindakan sebelum momen sekarang. Misalnya, hujan.
Future tense- Mewakili terjadinya suatu tindakan setelah momen saat ini. Misalnya, akan turun hujan.
Aspek
Kategori tata bahasa ini dapat didefinisikan sebagai pandangan yang diambil dari suatu peristiwa. Ini bisa dari jenis berikut -
Perfective aspect- Tampilan diambil secara keseluruhan dan lengkap dalam aspek. Misalnya simple past tense sepertiyesterday I met my friend, dalam bahasa Inggris adalah kesempurnaan dalam aspek karena memandang acara tersebut secara lengkap dan utuh.
Imperfective aspect- Tampilan dianggap berkelanjutan dan tidak lengkap dalam aspeknya. Misalnya, present participle tense sepertiI am working on this problem, dalam bahasa Inggris tidak sempurna dalam aspek karena memandang acara tersebut tidak lengkap dan berkelanjutan.
Suasana hati
Kategori gramatikal ini agak sulit untuk didefinisikan tetapi secara sederhana dapat dinyatakan sebagai indikasi sikap pembicara terhadap apa yang dia bicarakan. Ini juga merupakan fitur tata bahasa dari kata kerja. Ini berbeda dari tenses gramatikal dan aspek gramatikal. Contoh mood indikatif, interogatif, imperatif, injunctive, subjunctive, potential, optative, gerunds dan participles.
Persetujuan
Itu juga disebut kerukunan. Itu terjadi ketika sebuah kata berubah dari bergantung pada kata lain yang terkait dengannya. Dengan kata lain, ini melibatkan membuat nilai dari beberapa kategori tata bahasa sesuai antara kata-kata atau bagian dari pidato yang berbeda. Berikut adalah kesepakatan berdasarkan kategori gramatikal lainnya -
Agreement based on Person- Ini adalah kesepakatan antara subjek dan kata kerja. Misalnya, kita selalu menggunakan "Saya" dan "Dia" tetapi tidak pernah menggunakan "Dia" dan "Saya adalah".
Agreement based on Number- Kesepakatan ini antara subjek dan kata kerja. Dalam hal ini, ada bentuk verba khusus untuk orang pertama tunggal, orang kedua jamak dan seterusnya. Misalnya, orang pertama tunggal: Saya sungguh, orang kedua jamak: Kami benar-benar, orang ketiga tunggal: Anak laki-laki menyanyi, orang ketiga jamak: Anak laki-laki bernyanyi.
Agreement based on Gender- Dalam bahasa Inggris, ada kesepakatan dalam gender antara kata ganti dan anteseden. Misalnya, Dia mencapai tujuannya. Kapal mencapai tujuannya.
Agreement based on Case- Perjanjian semacam ini bukanlah fitur bahasa Inggris yang signifikan. Misalnya, siapa yang lebih dulu - dia atau saudara perempuannya?
Sintaks Bahasa Lisan
Tata bahasa Inggris tertulis dan lisan memiliki banyak ciri umum tetapi seiring dengan itu, mereka juga berbeda dalam beberapa aspek. Fitur berikut membedakan antara tata bahasa Inggris lisan dan tulisan -
Disfluencies dan Repair
Fitur mencolok ini membuat tata bahasa Inggris lisan dan tulisan berbeda satu sama lain. Ini secara individu dikenal sebagai fenomena disfluensi dan secara kolektif sebagai fenomena perbaikan. Disfluensi termasuk penggunaan berikut -
Fillers words- Terkadang di sela-sela kalimat, kami menggunakan beberapa kata pengisi. Mereka disebut pengisi jeda pengisi. Contoh dari kata-kata tersebut adalah uh dan um.
Reparandum and repair- Segmen kata yang berulang di antara kalimat disebut reparandum. Di segmen yang sama, kata yang diubah disebut perbaikan. Pertimbangkan contoh berikut untuk memahami ini -
Does ABC airlines offer any one-way flights uh one-way fares for 5000 rupees?
Pada kalimat di atas, penerbangan satu arah merupakan reparadum dan penerbangan satu arah adalah perbaikan.
Mulai ulang
Setelah pengisi jeda, restart terjadi. Misalnya, pada kalimat di atas, restart terjadi ketika pembicara mulai bertanya tentang penerbangan satu arah kemudian berhenti, perbaiki sendiri dengan jeda pengisi dan kemudian memulai kembali menanyakan tentang tarif satu arah.
Fragmen Kata
Terkadang kita mengucapkan kalimat dengan potongan kata yang lebih kecil. Sebagai contoh,wwha-what is the time? Di sini kata-katanya w-wha adalah fragmen kata.