Verarbeitung natürlicher Sprache - Inception

In diesem Kapitel werden wir den Beginn der natürlichen Sprache in der Verarbeitung natürlicher Sprache diskutieren. Lassen Sie uns zunächst verstehen, was Grammatik in natürlicher Sprache ist.

Grammatik der natürlichen Sprache

Für die Linguistik ist Sprache eine Gruppe willkürlicher Stimmzeichen. Wir können sagen, dass Sprache kreativ ist, von Regeln regiert wird, sowohl angeboren als auch universell zugleich. Auf der anderen Seite ist es auch menschlich. Die Art der Sprache ist für verschiedene Menschen unterschiedlich. Es gibt viele Missverständnisse über die Natur der Sprache. Deshalb ist es sehr wichtig, die Bedeutung des mehrdeutigen Begriffs zu verstehen‘grammar’. In der Linguistik kann der Begriff Grammatik als die Regeln oder Prinzipien definiert werden, mit deren Hilfe die Sprache funktioniert. Im weitesten Sinne können wir die Grammatik in zwei Kategorien einteilen -

Beschreibende Grammatik

Das Regelwerk, in dem Linguistik und Grammatiker die Grammatik des Sprechers formulieren, wird als beschreibende Grammatik bezeichnet.

Perspektivische Grammatik

Es ist ein ganz anderer Sinn für Grammatik, der versucht, einen Standard der Korrektheit in der Sprache aufrechtzuerhalten. Diese Kategorie hat wenig mit der tatsächlichen Arbeitsweise der Sprache zu tun.

Komponenten der Sprache

Die Sprache des Studiums ist in die miteinander verbundenen Komponenten unterteilt, die sowohl konventionelle als auch willkürliche Unterteilungen der sprachlichen Untersuchung sind. Die Erklärung dieser Komponenten lautet wie folgt:

Phonologie

Die allererste Komponente der Sprache ist die Phonologie. Es ist das Studium der Sprachlaute einer bestimmten Sprache. Der Ursprung des Wortes kann auf die griechische Sprache zurückgeführt werden, wobei "Telefon" Ton oder Stimme bedeutet. Phonetik, eine Unterteilung der Phonologie, ist das Studium der Sprachlaute der menschlichen Sprache aus der Perspektive ihrer Produktion, Wahrnehmung oder ihrer physikalischen Eigenschaften. IPA (International Phonetic Alphabet) ist ein Werkzeug, das menschliche Klänge während des Studiums der Phonologie regelmäßig darstellt. In IPA repräsentiert jedes geschriebene Symbol einen und nur einen Sprachton und umgekehrt.

Phoneme

Es kann als eine der Toneinheiten definiert werden, die ein Wort in einer Sprache von einem anderen unterscheiden. In der Sprache werden Phoneme zwischen Schrägstrichen geschrieben. Zum Beispiel Phonem/k/ kommt in den Wörtern wie Kit, Sketch vor.

Morphologie

Es ist die zweite Komponente der Sprache. Es ist das Studium der Struktur und Klassifizierung der Wörter in einer bestimmten Sprache. Der Ursprung des Wortes liegt in der griechischen Sprache, wo das Wort "Morphe" "Form" bedeutet. Die Morphologie berücksichtigt die Prinzipien der Wortbildung in einer Sprache. Mit anderen Worten, wie Klänge zu sinnvollen Einheiten wie Präfixen, Suffixen und Wurzeln kombiniert werden. Es wird auch berücksichtigt, wie Wörter in Wortarten gruppiert werden können.

Lexeme

In der Linguistik wird die abstrakte Einheit der morphologischen Analyse, die einer Reihe von Formen eines einzelnen Wortes entspricht, als Lexem bezeichnet. Die Art und Weise, wie ein Lexem in einem Satz verwendet wird, wird durch seine grammatikalische Kategorie bestimmt. Lexem kann ein einzelnes Wort oder ein Mehrwort sein. Zum Beispiel ist das Wort Talk ein Beispiel für ein einzelnes Wortlexem, das viele grammatikalische Varianten wie Talk, Talked und Talking haben kann. Das Mehrwortlexem kann aus mehr als einem orthografischen Wort bestehen. Zum Beispiel sind Sprechen, Durchziehen usw. Beispiele für Mehrwortlexeme.

Syntax

Es ist die dritte Komponente der Sprache. Es ist das Studium der Reihenfolge und Anordnung der Wörter in größeren Einheiten. Das Wort kann auf die griechische Sprache zurückgeführt werden, wo das Wort suntassein "in Ordnung bringen" bedeutet. Es untersucht die Art der Sätze und ihre Struktur, die Klauseln, die Phrasen.

Semantik

Es ist die vierte Komponente der Sprache. Es ist das Studium, wie Bedeutung vermittelt wird. Die Bedeutung kann sich auf die Außenwelt oder auf die Grammatik des Satzes beziehen. Das Wort kann auf die griechische Sprache zurückgeführt werden, wobei das Wort semainein "bedeuten", "zeigen", "signalisieren" bedeutet.

Pragmatik

Es ist die fünfte Komponente der Sprache. Es ist das Studium der Funktionen der Sprache und ihrer Verwendung im Kontext. Der Ursprung des Wortes kann auf die griechische Sprache zurückgeführt werden, wo das Wort "Pragma" "Tat", "Affäre" bedeutet.

Grammatische Kategorien

Eine grammatikalische Kategorie kann als eine Klasse von Einheiten oder Merkmalen innerhalb der Grammatik einer Sprache definiert werden. Diese Einheiten sind die Bausteine ​​der Sprache und haben eine Reihe gemeinsamer Merkmale. Grammatische Kategorien werden auch als grammatikalische Merkmale bezeichnet.

Das Inventar der grammatikalischen Kategorien wird unten beschrieben -

Nummer

Es ist die einfachste grammatikalische Kategorie. Wir haben zwei Begriffe, die sich auf diese Kategorie beziehen - Singular und Plural. Singular ist das Konzept von "Eins", während Plural das Konzept von "Mehr als Eins" ist. Zum Beispiel Hund / Hunde, dies / diese.

Geschlecht

Das grammatikalische Geschlecht wird durch Variation der Personalpronomen und der 3. Person ausgedrückt. Beispiele für grammatikalische Geschlechter sind einzigartig - er, sie, es; die erste und zweite Person bilden sich - ich, wir und du; Die Pluralform der 3. Person ist entweder das gemeinsame Geschlecht oder das neutrale Geschlecht.

Person

Eine andere einfache grammatikalische Kategorie ist Person. Darunter werden folgende drei Begriffe anerkannt:

  • 1st person - Die Person, die spricht, wird als 1. Person anerkannt.

  • 2nd person - Die Person, die der Hörer ist oder mit der gesprochen wird, wird als 2. Person anerkannt.

  • 3rd person - Die Person oder Sache, über die wir sprechen, wird als 3. Person anerkannt.

Fall

Es ist eine der schwierigsten grammatikalischen Kategorien. Es kann als Hinweis auf die Funktion einer Nominalphrase (NP) oder die Beziehung einer Nominalphrase zu einem Verb oder zu den anderen Nominalphrasen im Satz definiert werden. Wir haben die folgenden drei Fälle in Personal- und Interrogativpronomen ausgedrückt:

  • Nominative case- Es ist die Funktion des Subjekts. Zum Beispiel ich, wir, du, er, sie, es, sie und die sind nominativ.

  • Genitive case- Es ist die Funktion des Besitzers. Zum Beispiel mein / mein, unser / unser, sein, ihr / ihr, sein, ihr / ihr, dessen Genitiv sind.

  • Objective case- Es ist die Funktion des Objekts. Zum Beispiel ich, wir, du, er, sie, sie, die objektiv sind.

Grad

Diese grammatikalische Kategorie bezieht sich auf Adjektive und Adverbien. Es hat die folgenden drei Begriffe -

  • Positive degree- Es drückt eine Qualität aus. Zum Beispiel sind groß, schnell, schön positive Grade.

  • Comparative degree- Es drückt einen höheren Grad oder eine höhere Intensität der Qualität in einem von zwei Elementen aus. Zum Beispiel sind größere, schnellere und schönere Vergleichsgrade.

  • Superlative degree- Es drückt den größten Grad oder die größte Intensität der Qualität in einem von drei oder mehr Elementen aus. Zum Beispiel sind die größten, schnellsten und schönsten Abschlüsse der Superlative.

Bestimmtheit und Unbestimmtheit

Beide Konzepte sind sehr einfach. Die uns bekannte Bestimmtheit stellt einen Referenten dar, der dem Sprecher oder Hörer bekannt, vertraut oder identifizierbar ist. Andererseits stellt die Unbestimmtheit einen Referenten dar, der nicht bekannt oder unbekannt ist. Das Konzept kann im gleichzeitigen Auftreten eines Artikels mit einem Substantiv verstanden werden -

  • definite article- die

  • indefinite article- a / an

Tempus

Diese grammatikalische Kategorie bezieht sich auf das Verb und kann als sprachliche Angabe der Zeit einer Handlung definiert werden. Eine Zeitform stellt eine Beziehung her, weil sie den Zeitpunkt eines Ereignisses in Bezug auf den Moment des Sprechens angibt. Im Allgemeinen handelt es sich um die folgenden drei Typen:

  • Present tense- Repräsentiert das Auftreten einer Aktion im gegenwärtigen Moment. Zum Beispiel arbeitet Ram hart.

  • Past tense- Repräsentiert das Auftreten einer Aktion vor dem gegenwärtigen Moment. Zum Beispiel hat es geregnet.

  • Future tense- Repräsentiert das Auftreten einer Aktion nach dem gegenwärtigen Moment. Zum Beispiel wird es regnen.

Aspekt

Diese grammatikalische Kategorie kann als die Ansicht eines Ereignisses definiert werden. Es kann von den folgenden Typen sein -

  • Perfective aspect- Die Ansicht wird in dem Aspekt als Ganzes und Vollständiges betrachtet. Zum Beispiel die einfache Vergangenheitsform wieyesterday I met my friend, auf Englisch ist in Aspekt perfekt, da es die Veranstaltung als vollständig und vollständig betrachtet.

  • Imperfective aspect- Die Ansicht wird in diesem Aspekt als fortlaufend und unvollständig angesehen. Zum Beispiel mag das Partizip Präsens wieI am working on this problem, auf Englisch ist in Aspekt unvollkommen, da es die Veranstaltung als unvollständig und fortlaufend ansieht.

Stimmung

Diese grammatikalische Kategorie ist etwas schwierig zu definieren, kann aber einfach als Hinweis auf die Einstellung des Sprechers zu dem, worüber er spricht, angegeben werden. Es ist auch das grammatikalische Merkmal von Verben. Es unterscheidet sich von grammatikalischen Zeitformen und grammatikalischen Aspekten. Die Beispiele für Stimmungen sind indikativ, fragend, imperativ, injjunktiv, Konjunktiv, potentiell, optativ, Gerundien und Partizipien.

Zustimmung

Es wird auch Übereinstimmung genannt. Es passiert, wenn sich ein Wort von den anderen Wörtern ändert, auf die es sich bezieht. Mit anderen Worten, es geht darum, dass der Wert einer grammatikalischen Kategorie zwischen verschiedenen Wörtern oder einem Teil der Sprache übereinstimmt. Es folgen die Vereinbarungen, die auf anderen grammatikalischen Kategorien basieren -

  • Agreement based on Person- Es ist die Übereinstimmung zwischen Subjekt und Verb. Zum Beispiel verwenden wir immer "Ich bin" und "Er ist", aber niemals "Er ist" und "Ich bin".

  • Agreement based on Number- Diese Vereinbarung besteht zwischen Subjekt und Verb. In diesem Fall gibt es spezielle Verbformen für Singular der ersten Person, Plural der zweiten Person und so weiter. Zum Beispiel 1. Person Singular: Ich bin es wirklich, 2. Person Plural: Wir sind es wirklich, 3. Person Singular: Der Junge singt, 3. Person Plural: Die Jungen singen.

  • Agreement based on Gender- Auf Englisch besteht eine geschlechtsspezifische Übereinstimmung zwischen Pronomen und Antezedenzien. Zum Beispiel erreichte er sein Ziel. Das Schiff erreichte ihr Ziel.

  • Agreement based on Case- Diese Art der Vereinbarung ist kein wesentliches Merkmal des Englischen. Wer kam zum Beispiel zuerst - er oder seine Schwester?

Syntax der gesprochenen Sprache

Das geschriebene Englisch und die gesprochene englische Grammatik haben viele Gemeinsamkeiten, aber zusammen unterscheiden sie sich auch in einer Reihe von Aspekten. Die folgenden Merkmale unterscheiden zwischen der gesprochenen und der geschriebenen englischen Grammatik:

Beeinträchtigungen und Reparaturen

Dieses auffällige Merkmal unterscheidet die gesprochene und geschriebene englische Grammatik voneinander. Es ist individuell als Phänomen der Beeinträchtigungen und gemeinsam als Phänomen der Reparatur bekannt. Zu den Beeinträchtigungen gehört die Verwendung von Folgendem:

  • Fillers words- Manchmal verwenden wir zwischen den Sätzen einige Füllwörter. Sie werden Füllstoffe der Füllstoffpause genannt. Beispiele für solche Wörter sind uh und um.

  • Reparandum and repair- Das wiederholte Wortsegment zwischen den Sätzen wird als Reparandum bezeichnet. Im selben Segment wird das geänderte Wort als Reparatur bezeichnet. Betrachten Sie das folgende Beispiel, um dies zu verstehen:

Does ABC airlines offer any one-way flights uh one-way fares for 5000 rupees?

Im obigen Satz ist Einwegflug ein Reparadum und Einwegflug ist eine Reparatur.

Startet neu

Nach der Füllpause erfolgt ein Neustart. Im obigen Satz treten beispielsweise Neustarts auf, wenn der Sprecher nach Einwegflügen fragt und dann anhält, sich durch eine Füllpause korrigiert und dann erneut nach Einwegpreisen fragt.

Wortfragmente

Manchmal sprechen wir die Sätze mit kleineren Wortfragmenten. Zum Beispiel,wwha-what is the time? Hier die Worte w-wha sind Wortfragmente.