Reconhecimento de voz

A modalidade biométrica de reconhecimento de voz é uma combinação de modalidades fisiológicas e comportamentais. O reconhecimento de voz nada mais é do que reconhecimento de som. Ele se baseia em recursos influenciados por -

Physiological Component - Forma física, tamanho e saúde das cordas vocais, lábios, dentes, língua e cavidade bucal de uma pessoa.
Behavioral Component - Estado emocional da pessoa ao falar, sotaques, tom, tom, ritmo de fala, murmúrios, etc.

Sistema de Reconhecimento de Voz

O reconhecimento de voz também é chamado de reconhecimento de alto-falante. No momento da inscrição, o usuário precisa falar uma palavra ou frase em um microfone. Isso é necessário para adquirir amostra de fala de um candidato.

O sinal elétrico do microfone é convertido em sinal digital por um conversor Analógico para Digital (ADC). Ele é gravado na memória do computador como uma amostra digitalizada. O computador então compara e tenta combinar a voz de entrada do candidato com a amostra de voz digitalizada armazenada e identifica o candidato.

Modalidades de reconhecimento de voz

Existem duas variantes de reconhecimento de voz - speaker dependent e speaker independent.

O reconhecimento de voz dependente do locutor depende do conhecimento das características particulares da voz do candidato. Este sistema aprende essas características por meio do treinamento de voz (ou inscrição).

O sistema precisa ser treinado para que os usuários se acostumem a um sotaque e tom específicos antes de usar para reconhecer o que foi dito.
É uma boa opção se houver apenas um usuário para usar o sistema.

Os sistemas independentes de locutor são capazes de reconhecer a fala de diferentes usuários, restringindo os contextos da fala, como palavras e frases. Esses sistemas são usados para interfaces telefônicas automatizadas.

Eles não exigem o treinamento do sistema em cada usuário individual.
Eles são uma boa escolha para serem usados por pessoas diferentes, onde não é necessário reconhecer as características de fala de cada candidato.

Diferença entre reconhecimento de voz e fala

O reconhecimento de alto-falante e o reconhecimento de fala são erroneamente considerados iguais; mas são tecnologias diferentes. Vamos ver como -

Reconhecimento de alto-falante (reconhecimento de voz)	Reconhecimento de fala
O objetivo do reconhecimento de voz é reconhecer quem está falando.	O reconhecimento de fala visa compreender e compreender O QUE foi falado.
É usado para identificar uma pessoa analisando seu tom, tom de voz e sotaque.	Ele é usado em computação manual, mapa ou navegação de menu.

Méritos do reconhecimento de voz

É fácil de implementar.

Deméritos do reconhecimento de voz

É suscetível à qualidade do microfone e ao ruído.
A incapacidade de controlar os fatores que afetam o sistema de entrada pode diminuir significativamente o desempenho.
Alguns sistemas de verificação de alto-falante também são suscetíveis a ataques de falsificação por meio de voz gravada.

Aplicações de reconhecimento de voz

Realização de transações por telefone e internet.
Trabalhando com sistemas bancários e de saúde baseados em Resposta Interativa de Voz (IRV).
Aplicação de assinaturas de áudio para documentos digitais.
Em entretenimento e serviços de emergência.
Em sistemas de educação online.