Reconhecimento de voz
A modalidade biométrica de reconhecimento de voz é uma combinação de modalidades fisiológicas e comportamentais. O reconhecimento de voz nada mais é do que reconhecimento de som. Ele se baseia em recursos influenciados por -
Physiological Component - Forma física, tamanho e saúde das cordas vocais, lábios, dentes, língua e cavidade bucal de uma pessoa.
Behavioral Component - Estado emocional da pessoa ao falar, sotaques, tom, tom, ritmo de fala, murmúrios, etc.
Sistema de Reconhecimento de Voz
O reconhecimento de voz também é chamado de reconhecimento de alto-falante. No momento da inscrição, o usuário precisa falar uma palavra ou frase em um microfone. Isso é necessário para adquirir amostra de fala de um candidato.
O sinal elétrico do microfone é convertido em sinal digital por um conversor Analógico para Digital (ADC). Ele é gravado na memória do computador como uma amostra digitalizada. O computador então compara e tenta combinar a voz de entrada do candidato com a amostra de voz digitalizada armazenada e identifica o candidato.
Modalidades de reconhecimento de voz
Existem duas variantes de reconhecimento de voz - speaker dependent e speaker independent.
O reconhecimento de voz dependente do locutor depende do conhecimento das características particulares da voz do candidato. Este sistema aprende essas características por meio do treinamento de voz (ou inscrição).
O sistema precisa ser treinado para que os usuários se acostumem a um sotaque e tom específicos antes de usar para reconhecer o que foi dito.
É uma boa opção se houver apenas um usuário para usar o sistema.
Os sistemas independentes de locutor são capazes de reconhecer a fala de diferentes usuários, restringindo os contextos da fala, como palavras e frases. Esses sistemas são usados para interfaces telefônicas automatizadas.
Eles não exigem o treinamento do sistema em cada usuário individual.
Eles são uma boa escolha para serem usados por pessoas diferentes, onde não é necessário reconhecer as características de fala de cada candidato.
Diferença entre reconhecimento de voz e fala
O reconhecimento de alto-falante e o reconhecimento de fala são erroneamente considerados iguais; mas são tecnologias diferentes. Vamos ver como -
Reconhecimento de alto-falante (reconhecimento de voz) | Reconhecimento de fala |
---|---|
O objetivo do reconhecimento de voz é reconhecer quem está falando. | O reconhecimento de fala visa compreender e compreender O QUE foi falado. |
É usado para identificar uma pessoa analisando seu tom, tom de voz e sotaque. | Ele é usado em computação manual, mapa ou navegação de menu. |
Méritos do reconhecimento de voz
- É fácil de implementar.
Deméritos do reconhecimento de voz
- É suscetível à qualidade do microfone e ao ruído.
A incapacidade de controlar os fatores que afetam o sistema de entrada pode diminuir significativamente o desempenho.
Alguns sistemas de verificação de alto-falante também são suscetíveis a ataques de falsificação por meio de voz gravada.
Aplicações de reconhecimento de voz
- Realização de transações por telefone e internet.
Trabalhando com sistemas bancários e de saúde baseados em Resposta Interativa de Voz (IRV).
- Aplicação de assinaturas de áudio para documentos digitais.
- Em entretenimento e serviços de emergência.
- Em sistemas de educação online.