Xử lý ngôn ngữ tự nhiên - Khởi đầu
Trong chương này, chúng ta sẽ thảo luận về sự khởi đầu của ngôn ngữ tự nhiên trong Xử lý ngôn ngữ tự nhiên. Để bắt đầu, trước tiên chúng ta hãy hiểu Ngữ pháp Ngôn ngữ Tự nhiên là gì.
Ngữ pháp ngôn ngữ tự nhiên
Đối với ngôn ngữ học, ngôn ngữ là một nhóm các dấu hiệu phát âm tùy ý. Chúng ta có thể nói rằng ngôn ngữ là sáng tạo, bị chi phối bởi các quy tắc, bẩm sinh cũng như phổ quát cùng một lúc. Mặt khác, nó cũng là con người. Bản chất của ngôn ngữ là khác nhau đối với những người khác nhau. Có rất nhiều quan niệm sai lầm về bản chất của ngôn ngữ. Đó là lý do tại sao hiểu ý nghĩa của thuật ngữ mơ hồ là rất quan trọng‘grammar’. Trong ngôn ngữ học, thuật ngữ ngữ pháp có thể được định nghĩa là các quy tắc hoặc nguyên tắc với sự trợ giúp của ngôn ngữ hoạt động. Theo nghĩa rộng, chúng ta có thể chia ngữ pháp thành hai loại:
Ngữ pháp mô tả
Tập hợp các quy tắc, trong đó ngôn ngữ học và nhà ngữ pháp hình thành ngữ pháp của người nói được gọi là ngữ pháp mô tả.
Ngữ pháp phối cảnh
Đó là một ý nghĩa ngữ pháp rất khác, cố gắng duy trì một tiêu chuẩn về tính đúng đắn trong ngôn ngữ. Danh mục này ít liên quan đến hoạt động thực tế của ngôn ngữ.
Các thành phần của ngôn ngữ
Ngôn ngữ nghiên cứu được chia thành các thành phần có liên quan với nhau, đó là sự phân chia thông thường cũng như tùy ý của nghiên cứu ngôn ngữ học. Giải thích về các thành phần này như sau:
Âm vị học
Thành phần đầu tiên của ngôn ngữ là âm vị học. Nó là nghiên cứu về âm thanh lời nói của một ngôn ngữ cụ thể. Nguồn gốc của từ này có thể bắt nguồn từ tiếng Hy Lạp, trong đó 'phone' có nghĩa là âm thanh hoặc giọng nói. Ngữ âm học, một phân ngành của âm vị học là nghiên cứu âm thanh lời nói của ngôn ngữ con người từ góc độ sản xuất, tri giác hoặc các thuộc tính vật lý của chúng. IPA (Bảng chữ cái phiên âm quốc tế) là một công cụ biểu thị âm thanh của con người một cách thông thường trong khi nghiên cứu âm vị học. Trong IPA, mỗi ký hiệu được viết đại diện cho một và chỉ một âm thanh giọng nói và ngược lại.
Âm vị
Nó có thể được định nghĩa là một trong những đơn vị âm thanh giúp phân biệt từ này với từ khác trong một ngôn ngữ. Trong ngôn ngữ học, âm vị được viết giữa các dấu gạch chéo. Ví dụ, âm vị/k/ xảy ra trong các từ như kit, skit.
Hình thái học
Nó là thành phần thứ hai của ngôn ngữ. Nó là nghiên cứu về cấu trúc và phân loại của các từ trong một ngôn ngữ cụ thể. Nguồn gốc của từ này là từ tiếng Hy Lạp, trong đó từ 'morphe' có nghĩa là 'hình thức'. Hình thái học xem xét các nguyên tắc hình thành từ trong một ngôn ngữ. Nói cách khác, cách âm thanh kết hợp thành các đơn vị có nghĩa như tiền tố, hậu tố và gốc. Nó cũng xem xét cách các từ có thể được nhóm thành các phần của bài phát biểu.
Lexeme
Trong ngôn ngữ học, đơn vị trừu tượng của phép phân tích hình thái tương ứng với một tập hợp các dạng được thực hiện bởi một từ duy nhất được gọi là lexeme. Cách mà lexeme được sử dụng trong một câu được xác định bởi phạm trù ngữ pháp của nó. Lexeme có thể là từ riêng lẻ hoặc nhiều từ. Ví dụ, từ talk là một ví dụ về từ lexeme riêng lẻ, có thể có nhiều biến thể ngữ pháp như nói chuyện, nói chuyện và nói chuyện. Lexeme nhiều từ có thể được tạo thành từ nhiều hơn một từ chính thống. Ví dụ, nói lên, kéo qua, v.v. là những ví dụ của từ vựng nhiều từ.
Cú pháp
Nó là thành phần thứ ba của ngôn ngữ. Nó là nghiên cứu về trật tự và sắp xếp của các từ thành các đơn vị lớn hơn. Từ này có thể bắt nguồn từ tiếng Hy Lạp, trong đó từ suntassein có nghĩa là 'sắp xếp theo thứ tự'. Nó nghiên cứu loại câu và cấu trúc của chúng, mệnh đề, cụm từ.
Ngữ nghĩa
Nó là thành phần thứ tư của ngôn ngữ. Nó là nghiên cứu về cách ý nghĩa được truyền đạt. Ý nghĩa có thể liên quan đến thế giới bên ngoài hoặc có thể liên quan đến ngữ pháp của câu. Từ này có thể bắt nguồn từ tiếng Hy Lạp, trong đó từ semainein có nghĩa là 'biểu thị', 'hiển thị', 'tín hiệu'.
Ngữ dụng học
Nó là thành phần thứ năm của ngôn ngữ. Nó là nghiên cứu về các chức năng của ngôn ngữ và việc sử dụng nó trong ngữ cảnh. Nguồn gốc của từ này có thể được bắt nguồn từ tiếng Hy Lạp, nơi từ 'pragma' có nghĩa là 'hành động', 'sự việc'.
Danh mục ngữ pháp
Một phạm trù ngữ pháp có thể được định nghĩa là một lớp các đơn vị hoặc đặc điểm trong ngữ pháp của một ngôn ngữ. Các đơn vị này là các khối xây dựng của ngôn ngữ và có chung một tập hợp các đặc điểm. Các phạm trù ngữ pháp còn được gọi là đặc điểm ngữ pháp.
Danh mục ngữ pháp được mô tả dưới đây:
Con số
Nó là phạm trù ngữ pháp đơn giản nhất. Chúng tôi có hai thuật ngữ liên quan đến danh mục này là số ít và số nhiều. Số ít là khái niệm về 'một' trong khi số nhiều là khái niệm về 'nhiều hơn một'. Ví dụ, con chó / những con chó, cái này / những cái này.
Giới tính
Giới tính ngữ pháp được thể hiện bằng sự biến đổi của đại từ nhân xưng và ngôi thứ 3. Ví dụ về giới tính ngữ pháp là số ít - he, she, it; hình thức ngôi thứ nhất và thứ hai - tôi, chúng tôi và bạn; ngôi thứ 3 ở dạng số nhiều họ, là giới tính chung hoặc giới tính ngoài.
Người
Một phạm trù ngữ pháp đơn giản khác là người. Theo điều này, ba thuật ngữ sau được công nhận:
1st person - Người đang nói được công nhận là ngôi thứ nhất.
2nd person - Người nghe hoặc người được nói chuyện được coi là người thứ hai.
3rd person - Người hoặc sự vật mà chúng ta đang nói được coi là người thứ ba.
Trường hợp
Nó là một trong những phạm trù ngữ pháp khó nhất. Nó có thể được định nghĩa như một chỉ dẫn về chức năng của cụm danh từ (NP) hoặc mối quan hệ của cụm danh từ với động từ hoặc với các cụm danh từ khác trong câu. Chúng ta có ba trường hợp sau được diễn đạt bằng đại từ nhân xưng và nghi vấn:
Nominative case- Đó là chức năng của chủ thể. Ví dụ, tôi, chúng tôi, bạn, anh ấy, cô ấy, nó, họ và những người được đề cử.
Genitive case- Là chức năng của người chiếm hữu. Ví dụ, của tôi / của tôi, của chúng ta / của chúng ta, của anh ấy, của cô ấy / của cô ấy, của nó, của họ / của họ, những người có tính cách di truyền.
Objective case- Nó là chức năng của đối tượng. Ví dụ, tôi, chúng tôi, bạn, anh ấy, cô ấy, họ, những người khách quan.
Trình độ
Phạm trù ngữ pháp này liên quan đến tính từ và trạng từ. Nó có ba thuật ngữ sau:
Positive degree- Nó thể hiện một phẩm chất. Ví dụ, to, nhanh, đẹp là độ dương.
Comparative degree- Nó thể hiện mức độ hoặc cường độ cao hơn của chất lượng ở một trong hai mục. Ví dụ, lớn hơn, nhanh hơn, đẹp hơn là các mức độ so sánh.
Superlative degree- Nó thể hiện mức độ hoặc cường độ lớn nhất của chất lượng ở một trong ba hoặc nhiều mục. Ví dụ, lớn nhất, nhanh nhất, đẹp nhất là các độ bậc nhất.
Tính xác định và tính không xác định
Cả hai khái niệm này đều rất đơn giản. Tính xác định như chúng ta biết đại diện cho một tham chiếu, được người nói hoặc người nghe biết, quen thuộc hoặc có thể xác định được. Mặt khác, tính không xác định đại diện cho một tham chiếu không được biết đến hoặc không quen thuộc. Khái niệm này có thể được hiểu khi một mạo từ đồng xuất hiện với một danh từ -
definite article- cái
indefinite article- a / an
Bẩn quá
Phạm trù ngữ pháp này có liên quan đến động từ và có thể được định nghĩa là chỉ dẫn ngôn ngữ về thời gian của một hành động. Một thì thiết lập một quan hệ vì nó biểu thị thời gian của một sự kiện so với thời điểm nói. Nói chung, nó thuộc ba loại sau:
Present tense- Đại diện cho sự xuất hiện của một hành động trong thời điểm hiện tại. Ví dụ, Ram làm việc chăm chỉ.
Past tense- Đại diện cho sự xuất hiện của một hành động trước thời điểm hiện tại. Ví dụ, trời mưa.
Future tense- Đại diện cho sự xuất hiện của một hành động sau thời điểm hiện tại. Ví dụ, trời sẽ mưa.
Khía cạnh
Phạm trù ngữ pháp này có thể được định nghĩa là khung cảnh của một sự kiện. Nó có thể thuộc các loại sau:
Perfective aspect- Góc nhìn được xem xét một cách tổng thể và đầy đủ về khía cạnh. Ví dụ: thì quá khứ đơn nhưyesterday I met my friend, trong tiếng Anh là hoàn hảo về khía cạnh vì nó xem sự kiện là hoàn chỉnh và toàn bộ.
Imperfective aspect- Quan điểm được coi là liên tục và không đầy đủ về khía cạnh. Ví dụ, thì hiện tại phân từ nhưI am working on this problem, trong tiếng Anh là không hoàn hảo về khía cạnh vì nó coi sự kiện là không hoàn chỉnh và đang diễn ra.
Tâm trạng
Phạm trù ngữ pháp này hơi khó xác định nhưng có thể nói đơn giản là biểu thị thái độ của người nói đối với những gì họ đang nói. Nó cũng là đặc điểm ngữ pháp của động từ. Nó khác biệt với các thì ngữ pháp và khía cạnh ngữ pháp. Các ví dụ về tâm trạng là biểu thị, nghi vấn, mệnh lệnh, mệnh lệnh, mệnh lệnh, tiềm năng, lựa chọn, mầm mống và phân từ.
Hợp đồng
Nó còn được gọi là concord. Nó xảy ra khi một từ thay đổi từ phụ thuộc vào các từ khác mà nó có liên quan. Nói cách khác, nó liên quan đến việc làm cho giá trị của một số phạm trù ngữ pháp được thống nhất giữa các từ khác nhau hoặc một phần của lời nói. Tiếp theo là các thỏa thuận dựa trên các phạm trù ngữ pháp khác -
Agreement based on Person- Đó là sự thống nhất giữa chủ ngữ và động từ. Ví dụ, chúng tôi luôn sử dụng “Tôi là” và “Anh ấy là” nhưng không bao giờ sử dụng “Anh ấy” và “Tôi là”.
Agreement based on Number- Sự thống nhất này là giữa chủ ngữ và động từ. Trong trường hợp này, có những dạng động từ cụ thể cho ngôi thứ nhất số ít, ngôi thứ hai số nhiều, v.v. Ví dụ, ngôi thứ 1 số ít: I really am, ngôi thứ 2 số nhiều: We are are, ngôi thứ 3 số ít: The boy sings, ngôi thứ 3 số nhiều: The boys sing.
Agreement based on Gender- Trong tiếng Anh, có sự thống nhất về giới tính giữa đại từ và tiền thân. Ví dụ, Ngài đã đến đích. Con tàu đã đến đích.
Agreement based on Case- Loại thỏa thuận này không phải là một tính năng quan trọng của tiếng Anh. Ví dụ, ai đến trước - anh ấy hay em gái anh ấy?
Cú pháp ngôn ngữ nói
Ngữ pháp tiếng Anh viết và tiếng Anh nói có nhiều điểm chung nhưng cùng với đó, chúng cũng khác nhau ở một số khía cạnh. Các đặc điểm sau phân biệt giữa ngữ pháp tiếng Anh nói và viết:
Disfluencies và sửa chữa
Đặc điểm nổi bật này làm cho ngữ pháp tiếng Anh nói và viết khác nhau. Nó được gọi riêng là hiện tượng không phù hợp và gọi chung là hiện tượng sửa chữa. Sự không phù hợp bao gồm việc sử dụng sau:
Fillers words- Đôi khi ở giữa câu, chúng ta sử dụng một số từ phụ. Chúng được gọi là chất làm đầy tạm dừng chất làm đầy. Ví dụ về những từ như vậy là uh và um.
Reparandum and repair- Đoạn từ được lặp lại ở giữa câu được gọi là đoạn lặp lại. Trong cùng một phân đoạn, từ thay đổi được gọi là sửa chữa. Hãy xem xét ví dụ sau để hiểu điều này -
Does ABC airlines offer any one-way flights uh one-way fares for 5000 rupees?
Trong câu trên, chuyến bay một chiều là sửa chữa và chuyến bay một chiều là sửa chữa.
Khởi động lại
Sau khi tạm dừng bộ nạp, khởi động lại xảy ra. Ví dụ, trong câu trên, khởi động lại xảy ra khi người nói bắt đầu hỏi về các chuyến bay một chiều sau đó dừng lại, tự sửa bằng cách điền tạm dừng và sau đó bắt đầu lại hỏi về giá vé một chiều.
Các đoạn từ
Đôi khi chúng ta nói những câu với những đoạn từ nhỏ hơn. Ví dụ,wwha-what is the time? Đây các từ w-wha là các đoạn từ.