Processamento de linguagem natural - análise semântica
O objetivo da análise semântica é extrair o significado exato, ou você pode dizer o significado do dicionário a partir do texto. O trabalho do analisador semântico é verificar o significado do texto.
Já sabemos que a análise lexical também lida com o significado das palavras, então como a análise semântica difere da análise lexical? A análise lexical é baseada em token menor, mas, por outro lado, a análise semântica se concentra em blocos maiores. É por isso que a análise semântica pode ser dividida nas duas partes a seguir -
Estudando o significado de palavras individuais
É a primeira parte da análise semântica em que o estudo do significado de palavras individuais é realizado. Esta parte é chamada de semântica lexical.
Estudar a combinação de palavras individuais
Na segunda parte, as palavras individuais serão combinadas para fornecer significado às frases.
A tarefa mais importante da análise semântica é obter o significado adequado da frase. Por exemplo, analise a frase“Ram is great.”Nesta frase, o orador está falando sobre Lord Ram ou sobre uma pessoa cujo nome é Ram. É por isso que o trabalho, para obter o significado adequado da frase, de analisador semântico é importante.
Elementos de Análise Semântica
A seguir estão alguns elementos importantes da análise semântica -
Hiponímia
Pode ser definido como a relação entre um termo genérico e instâncias desse termo genérico. Aqui, o termo genérico é chamado de hiperínimo e suas instâncias são chamadas de hipônimos. Por exemplo, a palavra cor é hiperônimo e as cores azul, amarelo etc. são hipônimos.
Homonímia
Pode ser definido como as palavras com a mesma grafia ou mesma forma, mas com significados diferentes e não relacionados. Por exemplo, a palavra “morcego” é uma palavra homonímia porque morcego pode ser um instrumento para acertar uma bola ou morcego também é um mamífero voador noturno.
Polissemia
Polissemia é uma palavra grega que significa “muitos sinais”. É uma palavra ou frase com sentido diferente, mas relacionado. Em outras palavras, podemos dizer que a polissemia tem a mesma grafia, mas um significado diferente e relacionado. Por exemplo, a palavra "banco" é uma palavra polissêmica com os seguintes significados -
Uma instituição financeira.
O prédio em que essa instituição está localizada.
Um sinônimo para “confiar em”.
Diferença entre polissemia e homonímia
Tanto as palavras polissêmicas quanto as homonímicas têm a mesma sintaxe ou grafia. A principal diferença entre eles é que na polissemia, os significados das palavras estão relacionados, mas na homonímia, os significados das palavras não estão relacionados. Por exemplo, se falarmos sobre a mesma palavra “Banco”, podemos escrever o significado de 'uma instituição financeira' ou 'uma margem de rio'. Nesse caso, seria o exemplo de homônimo porque os significados não estão relacionados entre si.
Sinonímia
É a relação entre dois itens lexicais com formas diferentes, mas expressando o mesmo ou um significado próximo. Os exemplos são 'autor / escritor', 'fado / destino'.
Antonymy
É a relação entre dois itens lexicais que possuem simetria entre seus componentes semânticos em relação a um eixo. O escopo da antonímia é o seguinte -
Application of property or not - O exemplo é 'vida / morte', 'certeza / incerteza'
Application of scalable property - O exemplo é 'rico / pobre', 'quente / frio'
Application of a usage - O exemplo é 'pai / filho', 'lua / sol'.
Representação de Significado
A análise semântica cria uma representação do significado de uma frase. Mas antes de entrar no conceito e nas abordagens relacionadas à representação de significado, precisamos entender os blocos de construção do sistema semântico.
Blocos de construção do sistema semântico
Na representação de palavras ou representação do significado das palavras, os seguintes blocos de construção desempenham um papel importante -
Entities- Representa o indivíduo, como uma pessoa particular, local etc. Por exemplo, Haryana. Índia, Ram, todos são entidades.
Concepts - Representa a categoria geral dos indivíduos, como pessoa, cidade, etc.
Relations- Representa a relação entre entidades e conceito. Por exemplo, Ram é uma pessoa.
Predicates- Representa as estruturas verbais. Por exemplo, papéis semânticos e gramática de caso são exemplos de predicados.
Agora, podemos entender que a representação de significado mostra como reunir os blocos de construção dos sistemas semânticos. Em outras palavras, mostra como reunir entidades, conceitos, relações e predicados para descrever uma situação. Também permite o raciocínio sobre o mundo semântico.
Abordagens para representações de significado
A análise semântica usa as seguintes abordagens para a representação do significado -
Lógica de predicado de primeira ordem (FOPL)
Redes Semânticas
Frames
Dependência conceitual (CD)
Arquitetura baseada em regras
Case Grammar
Gráficos Conceituais
Necessidade de representações de significado
Uma questão que surge aqui é por que precisamos de representação de significado? Seguintes são as razões para o mesmo -
Ligação de elementos linguísticos a elementos não linguísticos
A primeira razão é que, com a ajuda da representação do significado, a ligação dos elementos linguísticos aos elementos não linguísticos pode ser feita.
Representando a variedade em nível léxico
Com a ajuda da representação do significado, formas canônicas não ambíguas podem ser representadas no nível lexical.
Pode ser usado para raciocinar
A representação de significado pode ser usada para raciocinar para verificar o que é verdadeiro no mundo, bem como para inferir o conhecimento a partir da representação semântica.
Semântica Lexical
A primeira parte da análise semântica, estudando o significado de palavras individuais, é chamada de semântica lexical. Inclui palavras, subpalavras, afixos (subunidades), palavras compostas e frases também. Todas as palavras, subpalavras, etc. são chamadas coletivamente de itens lexicais. Em outras palavras, podemos dizer que a semântica lexical é a relação entre itens lexicais, significado das frases e sintaxe da frase.
A seguir estão as etapas envolvidas na semântica lexical -
A classificação de itens lexicais como palavras, subpalavras, afixos, etc. é realizada na semântica lexical.
A decomposição de itens lexicais como palavras, subpalavras, afixos, etc. é realizada na semântica lexical.
Diferenças, bem como semelhanças entre várias estruturas semânticas lexicais também são analisadas.