Audio Front-End（AFE）アルゴリズム

Espressif の音響フロントエンドアルゴリズム

Espressif SoC で音声ユーザーインターフェースを
実現する高性能音響アルゴリズム

ノイズの多い遠距離環境でも優れた音声インタラクション性能を実現するためには、スマート音声デバイスにおける音響フロントエンド (Audio Front-End、AFE) アルゴリズムが不可欠です。Espressif の AI ラボでは、独自開発の AFE アルゴリズムフレームワークを提供しており、高性能な ESP32 および ESP32-S3 SoC 上で音響信号処理を実行することが可能です。これにより、ユーザーは高品質かつ安定した音声データを取得でき、優れた性能と高いコストパフォーマンスを両立するスマート音声製品の構築が可能となります。

AEC

BSS

WakeNet

音響エコーキャンセレーション

音響エコーキャンセレーション (Acoustic Echo Cancellation, AEC) アルゴリズムは、適応フィルタを用いて、マイク入力時に発生するエコー成分を除去する技術です。このアルゴリズムは、スマート音声デバイスがスピーカーで音声を再生しながら、マイクで音声を同時に収音するようなシナリオに適しています。

ブラインドソースセパレーション (BSS)

ブラインドソースセパレーション (Blind Source Separation, BSS) アルゴリズムは、複数のマイクロフォンを用いて音源の方向を推定し、特定の方向からの音声信号を強調する技術です。このアルゴリズムにより、ノイズの多い環境下でも目的とする音声ソースの音質を向上させることが可能です。

ノイズリダクション (NS)

ノイズリダクションアルゴリズムは、単一チャネルの音声信号処理に対応しており、掃除機やエアコンの動作音など、不要な非音声ノイズを効果的に除去します。これにより、処理対象となる音声信号の明瞭度と品質が大幅に向上します。

ウェイクワードエンジン (WakeNet)

WakeNet は、Espressif が独自に開発した高性能かつ低リソース消費のウェイクワード検出アルゴリズムであり、「Alexa」「ハイ、Espressif」「Hi, ESP」などのウェイクワードに対して素早く反応することができます。

アルゴリズムの特長

優れた音響性能

Espressif の AFE アルゴリズムは、Amazon Alexa のファーフィールド音声認識テストに合格しています。本アルゴリズムには、Espressif 独自開発のウェイクワードエンジン「WakeNet」が搭載されており、Amazon の多言語テスト要件にも対応可能です。

低リソース消費

Espressif の AFE アルゴリズムは、ESP32-S3 SoC に搭載された AI アクセラレータ向けに最適化されており、わずか約 22%の CPU 使用率、48 KB の SRAM、1.1 MB の PSRAM しか消費しません。これにより、ESP32-S3 をベースとしたお客様のアプリケーションにおいても、十分なリソースを確保することが可能です。

柔軟な製品設計

Espressif の AFE アルゴリズムは、シンプルかつ直感的な API インターフェースを提供しており、お客様は製品要件に応じて性能を動的に調整することが可能です。また、20～80mm のマイク間隔に対応しており、ハードウェア設計においても高い柔軟性を実現します。

Amazon 認証取得済みの AFE ソリューション

Espressif の AFE アルゴリズムは、Amazon Alexa 内蔵デバイス向けの Audio Front-End (AFE) 認証に合格しています。本アルゴリズムは、ESP32-S3 に搭載された AI アクセラレータ向けに最適化されており、ハードウェアと組み合わせることで、わずか 2 つのマイクだけで 360 度の音声収音が可能です。

AFE 開発

690 Bibo Road Block 2 Suite 204, Zhangjiang Shanghai, China

PG

メインメニュー