音声認識

音声認識生体認証モダリティは、生理学的モダリティと行動モダリティの両方を組み合わせたものです。音声認識は音声認識に他なりません。−の影響を受ける機能に依存しています

  • Physiological Component −人の声帯、唇、歯、舌、口の空洞の物理的な形状、サイズ、健康状態。

  • Behavioral Component −話しているときの人の感情状態、アクセント、口調、ピッチ、話しているペース、つぶやきなど。

音声認識システム

音声認識は話者認識とも呼ばれます。登録時に、ユーザーはマイクに向かって単語やフレーズを話す必要があります。これは、候補者の音声サンプルを取得するために必要です。

マイクからの電気信号は、アナログ-デジタル(ADC)コンバーターによってデジタル信号に変換されます。それはデジタル化されたサンプルとしてコンピュータのメモリに記録されます。次に、コンピュータは、候補者の入力音声を保存されたデジタル化された音声サンプルと比較して照合を試み、候補者を識別します。

音声認識モダリティ

音声認識には2つのバリエーションがあります- speaker dependent そして speaker independent

話者に依存する音声認識は、候補者の特定の音声特性の知識に依存しています。このシステムは、音声トレーニング(または登録)を通じてこれらの特性を学習します。

  • システムは、言われたことを認識するために採用する前に、特定のアクセントとトーンに慣れるようにユーザーにトレーニングする必要があります。

  • システムを使用するユーザーが1人だけの場合は、このオプションが適しています。

話者に依存しないシステムは、単語やフレーズなどの音声のコンテキストを制限することにより、さまざまなユーザーからの音声を認識することができます。これらのシステムは、自動電話インターフェースに使用されます。

  • 個々のユーザーごとにシステムをトレーニングする必要はありません。

  • これらは、各候補者のスピーチ特性を認識する必要がないさまざまな個人が使用するのに適しています。

音声認識と音声認識の違い

話者認識と音声認識は誤って同じものと見なされます。しかし、それらは異なるテクノロジーです。見てみましょう、どのように-

話者認識(音声認識) 音声認識
音声認識の目的は、WHOが話していることを認識することです。 音声認識は、何が話されたかを理解して理解することを目的としています。
声調、声の高さ、アクセントを分析して人を識別するために使用されます。 これは、ハンズフリーコンピューティング、マップ、またはメニューナビゲーションで使用されます。

音声認識のメリット

  • 実装は簡単です。

音声認識のデメリット

  • マイクの品質やノイズの影響を受けやすくなっています。
  • 入力システムに影響を与える要因を制御できないと、パフォーマンスが大幅に低下する可能性があります。

  • 一部の話者検証システムは、録音された音声によるなりすまし攻撃の影響を受けやすくなっています。

音声認識の応用

  • 電話およびインターネット取引の実行。
  • インタラクティブ音声応答(IRV)ベースの銀行および医療システムの操作。

  • デジタルドキュメントに音声署名を適用する。
  • 娯楽および緊急サービス。
  • オンライン教育システム。