Ambient Intelligence findet zunehmend in Verbrauchertechnologien Anwendung. Ein Beispiel sind die populären Smart Speaker, die sich per Sprachbefehl steuern lassen. Auch Navigationsysteme und Fahrzeugarmaturen setzen auf Sprachsteuerung, damit der Fahrer die Hände am Steuer lassen kann. Ebenso enthalten IoT-Sensoren und -Controller sowie Wearables vermehrt Benutzerschnittstellen, die mit Spracherkennung ausgestattet sind. Ein großes Plus dabei: Eine Benutzeroberfläche ist nicht nötig, wenn Geräte so klein sind, dass sich weder Touchscreen noch Bedientasten integrieren lassen.

Eckdaten

Aufgrund ihrer Größe passen MEMS-Mikrofone in Smart Speaker und Smartphones. Aber auch in anderen Anwendungsfeldern kommen sie zum Einsatz wie etwa Kameras, Fernsehern oder Robotern. Je nach Einsatzgebiet können die Ansprüche an das Mikrofon variieren. Der Artikel stellt die Funktionsweise sowie die unterschiedlichen Ansprüche dar und zeigt an Beispielen die unterschiedlichen Spezifikationen.

Eine Schlüsselrolle spielt bei solchen Designs das Mikrofon, das möglichst hochwertig und kostengünstig sein soll. In vielen Fällen reicht ein einzelnes Mikrofon nicht aus, da Hintergrundgeräusche wie etwa von Fernsehern, Stereoanlagen oder unterwegs vom Straßenverkehr oder Mitmenschen dem Mikrofon die Identifizierung erschweren. Deshalb haben Designer damit begonnen Array-Mikrofone zu verwenden. Diese Systeme identifizieren mithilfe von Beamforming wichtige Klangquellen im Raum und unterdrücken Interferenzen aus anderen Quellen. Somit lässt sich etwa die Stimme eines Benutzers verfolgen, der in Bewegung ist. Ist jedoch mehr als ein Benutzer in Reichweite, kann Blind-Signal-Separation (BSS) zum Einsatz kommen.

Funktionsweise von MEMS-Mikrofonen

Konventionelle Mikrofone sind aufgrund ihrer Größe für viele technische Anwendungsbereiche ungeeignet. Demgegenüber ermöglichen mikroelektromechanische Systeme (MEMS) ein Design, bei dem mehrere Mikrofone in einem Smartphone oder IoT-Sensorhub Platz finden. Folglich sind MEMS-Mikrofone in vielen Technologien enthalten, darunter Kameras, Sicherheitssysteme, digitale Sprachassistenten, Roboter, Fernsehgeräte und Fahrzeuginnenräume.

Beim klassischen Kondensatormikrofon ist eine biegsame Membran dicht vor einer Metallplatte angebracht. Das kapazitive Design der meisten MEMS-Mikrofone beruht auf demselben Grundprinzip. Typischerweise bestehen die Sensoren aus zwei bis drei durch einen Luftspalt getrennte, feststehende und bewegliche Platten, genauer aus einer Membran und ein oder zwei Rückwänden. Versetzt ein Klangimpuls die Membran in Schwingung, verstärken die Kapazitätsänderungen und die Signalkonditionierungselektronik die Spannung, die durch den Schaltkreis des Mikrofons geleitet wird.

Ein Design mit zwei Rückwänden hat den Vorteil, dass es ein differenzielles Ausgangssignal erzeugt, das die Auswirkung von Interferenzen minimiert. Das symmetrische Design sorgt zudem für ein reduziertes Rauschen. Ein differenzielles Ausgangssignal lässt sich auch leichter im analogen Bereich verarbeiten und resultiert deshalb in einem geringeren Energiebedarf. Darüber hinaus ist MEMS-Technologie hitzebeständig und verträglich gegenüber Reflow-Löten, was eine automatisierte Leiterplattenbestückung ermöglicht.

Unterschiedliche Ansprüche

Design mit zwei Rückwänden: MEMS-Mikrofone IM69D130 von Infineon.

Design mit zwei Rückwänden: MEMS-Mikrofone IM69D130 von Infineon. Mouser/Infineon

Die Anforderungen an Mikrofone in digitalen Systemen können stark variieren. In Smartphones und Kameras steht die Klangtreue im Vordergrund, da Benutzer Tonaufnahmen machen und abspielen möchten. TV-Geräte und Sicherheitssysteme benötigen wiederum keine absolute Klangtreue, sondern müssen für die Verarbeitung und Erkennung digitaler Signale optimiert sein. Selbstlernende Algorithmen können häufig von anderen Funktionen Gebrauch machen als Menschen. Ein Mikrofon, das für Wiedergabezwecke optimiert ist, betont diese Signalmerkmale unter Umständen nicht. Generell ist es aber wichtig, dass das Rauschen so minimal ausfällt wie nur möglich und das Mikrofon nicht anfällig ist für Eigenrauschen. Hierbei handelt es sich um RMS-Spannungsrauschen, das das Mikrofon selbst erzeugt, wenn es nicht auf externe Klänge reagiert. Ein solches Rauschen ist häufig das Resultat von systeminternen Interaktionen zwischen unterschiedlichen Elementen in den mechanischen und elektrischen Komponenten.

Spracherkennungssysteme erzielen häufig eine bessere Leistung, wenn das verwendete Mikrofon einen hohen akustischen Übersteuerungspunkt (Acoustic Overload Point, AOP) aufweist. Der AOP ist als Schalldruckpegel (SPL) definiert, an dem der Klirrfaktor 10 Prozentpunkte überschreitet, gemessen in dBSPL (Decibel Sound Pressure Level). Ein hoher AOP ist nötig, da das Sprachsignal im Vergleich zu den Umgebungsgeräuschen oft relativ leise ist. Bei einem Aktivlautsprecher kann dieses Rauschen auch vom Gerät selbst stammen, und der Benutzer kann am anderen Ende des Raumes sitzen, was den Signal-Rauschabstand weiter reduziert. Ein hoher AOP sorgt dafür, dass die Algorithmen über genügend Spielraum verfügen, um Störsignale zu unterdrücken und ein relativ verzerrungsfreies Sprachsignal zu empfangen.

Verschiedene Mikrofone für verschiedene Anwendungen finden Sie auf der nächsten Seite.

Seite 1 von 212