Design mit zwei Rückwänden: MEMS-Mikrofone IM69D130 von Infineon.

Design mit zwei Rückwänden: MEMS-Mikrofone IM69D130 von Infineon. (Bild: Mouser/Infineon)

Ambient Intelligence findet zunehmend in Verbrauchertechnologien Anwendung. Ein Beispiel sind die populären Smart Speaker, die sich per Sprachbefehl steuern lassen. Auch Navigationsysteme und Fahrzeugarmaturen setzen auf Sprachsteuerung, damit der Fahrer die Hände am Steuer lassen kann. Ebenso enthalten IoT-Sensoren und -Controller sowie Wearables vermehrt Benutzerschnittstellen, die mit Spracherkennung ausgestattet sind. Ein großes Plus dabei: Eine Benutzeroberfläche ist nicht nötig, wenn Geräte so klein sind, dass sich weder Touchscreen noch Bedientasten integrieren lassen.

Eckdaten

Aufgrund ihrer Größe passen MEMS-Mikrofone in Smart Speaker und Smartphones. Aber auch in anderen Anwendungsfeldern kommen sie zum Einsatz wie etwa Kameras, Fernsehern oder Robotern. Je nach Einsatzgebiet können die Ansprüche an das Mikrofon variieren. Der Artikel stellt die Funktionsweise sowie die unterschiedlichen Ansprüche dar und zeigt an Beispielen die unterschiedlichen Spezifikationen.

Eine Schlüsselrolle spielt bei solchen Designs das Mikrofon, das möglichst hochwertig und kostengünstig sein soll. In vielen Fällen reicht ein einzelnes Mikrofon nicht aus, da Hintergrundgeräusche wie etwa von Fernsehern, Stereoanlagen oder unterwegs vom Straßenverkehr oder Mitmenschen dem Mikrofon die Identifizierung erschweren. Deshalb haben Designer damit begonnen Array-Mikrofone zu verwenden. Diese Systeme identifizieren mithilfe von Beamforming wichtige Klangquellen im Raum und unterdrücken Interferenzen aus anderen Quellen. Somit lässt sich etwa die Stimme eines Benutzers verfolgen, der in Bewegung ist. Ist jedoch mehr als ein Benutzer in Reichweite, kann Blind-Signal-Separation (BSS) zum Einsatz kommen.

Funktionsweise von MEMS-Mikrofonen

Konventionelle Mikrofone sind aufgrund ihrer Größe für viele technische Anwendungsbereiche ungeeignet. Demgegenüber ermöglichen mikroelektromechanische Systeme (MEMS) ein Design, bei dem mehrere Mikrofone in einem Smartphone oder IoT-Sensorhub Platz finden. Folglich sind MEMS-Mikrofone in vielen Technologien enthalten, darunter Kameras, Sicherheitssysteme, digitale Sprachassistenten, Roboter, Fernsehgeräte und Fahrzeuginnenräume.

Beim klassischen Kondensatormikrofon ist eine biegsame Membran dicht vor einer Metallplatte angebracht. Das kapazitive Design der meisten MEMS-Mikrofone beruht auf demselben Grundprinzip. Typischerweise bestehen die Sensoren aus zwei bis drei durch einen Luftspalt getrennte, feststehende und bewegliche Platten, genauer aus einer Membran und ein oder zwei Rückwänden. Versetzt ein Klangimpuls die Membran in Schwingung, verstärken die Kapazitätsänderungen und die Signalkonditionierungselektronik die Spannung, die durch den Schaltkreis des Mikrofons geleitet wird.

Ein Design mit zwei Rückwänden hat den Vorteil, dass es ein differenzielles Ausgangssignal erzeugt, das die Auswirkung von Interferenzen minimiert. Das symmetrische Design sorgt zudem für ein reduziertes Rauschen. Ein differenzielles Ausgangssignal lässt sich auch leichter im analogen Bereich verarbeiten und resultiert deshalb in einem geringeren Energiebedarf. Darüber hinaus ist MEMS-Technologie hitzebeständig und verträglich gegenüber Reflow-Löten, was eine automatisierte Leiterplattenbestückung ermöglicht.

Unterschiedliche Ansprüche

Die Anforderungen an Mikrofone in digitalen Systemen können stark variieren. In Smartphones und Kameras steht die Klangtreue im Vordergrund, da Benutzer Tonaufnahmen machen und abspielen möchten. TV-Geräte und Sicherheitssysteme benötigen wiederum keine absolute Klangtreue, sondern müssen für die Verarbeitung und Erkennung digitaler Signale optimiert sein. Selbstlernende Algorithmen können häufig von anderen Funktionen Gebrauch machen als Menschen. Ein Mikrofon, das für Wiedergabezwecke optimiert ist, betont diese Signalmerkmale unter Umständen nicht. Generell ist es aber wichtig, dass das Rauschen so minimal ausfällt wie nur möglich und das Mikrofon nicht anfällig ist für Eigenrauschen. Hierbei handelt es sich um RMS-Spannungsrauschen, das das Mikrofon selbst erzeugt, wenn es nicht auf externe Klänge reagiert. Ein solches Rauschen ist häufig das Resultat von systeminternen Interaktionen zwischen unterschiedlichen Elementen in den mechanischen und elektrischen Komponenten.

Spracherkennungssysteme erzielen häufig eine bessere Leistung, wenn das verwendete Mikrofon einen hohen akustischen Übersteuerungspunkt (Acoustic Overload Point, AOP) aufweist. Der AOP ist als Schalldruckpegel (SPL) definiert, an dem der Klirrfaktor 10 Prozentpunkte überschreitet, gemessen in dBSPL (Decibel Sound Pressure Level). Ein hoher AOP ist nötig, da das Sprachsignal im Vergleich zu den Umgebungsgeräuschen oft relativ leise ist. Bei einem Aktivlautsprecher kann dieses Rauschen auch vom Gerät selbst stammen, und der Benutzer kann am anderen Ende des Raumes sitzen, was den Signal-Rauschabstand weiter reduziert. Ein hoher AOP sorgt dafür, dass die Algorithmen über genügend Spielraum verfügen, um Störsignale zu unterdrücken und ein relativ verzerrungsfreies Sprachsignal zu empfangen.

Verschiedene Mikrofone für verschiedene Anwendungen finden Sie auf der nächsten Seite.

Hoher AOP, geringes Rauschen

Um einen hohen AOP und geringes Eigenrauschen zu erreichen, hat sich Infineon beim IM69D130 für ein Design mit zwei Rückwänden entschieden, das konzeptuell den in Tonstudios verwendeten Kondensatormikrofonen ähnelt. Selbst bei einem Schalldruckpegel von 128 dB liegt der Verzerrungsgrad unter 1 Prozent, während der AOP des Mikrofons 130 dBSPL beträgt. Es verfügt über einen Frequenzgang mit einem flachflankigen Abfall von 28 Hz und einer hohen Ausgangslinearität. Diese Merkmale sorgen in Kombination mit einer geringen Fertigungstoleranz für eine enge Phasenanpassung zwischen den Mikrofonen, was in Anwendungen mit Mikrofon-Arrays besonders wichtig ist.

Wenig HF-Schutz notwendig

Das MEMS-Mikrofon ICS‐52000 von Invensense verfügt über ein rauscharmes digitales TDM-Ausgangssignal.

Das MEMS-Mikrofon ICS‐52000 von Invensense verfügt über ein rauscharmes digitales TDM-Ausgangssignal. Mouser/Invensense

Durch den Einsatz digitaler Pulsdichtemodulation für das Ausgangssignal werden keine analogen Komponenten benötigt, um das ausgehende Mikrofonsignal zu verarbeiten. So wird der Bedarf an HF-Schutz auf der Leiterplatte reduziert und der in Mikrofon-Array-Anwendungen benötigte Platinenplatz verringert. Um umfangreiche Mikrofon-Arrays zu unterstützen, verfügt das Invensense-ICS‐52000 von TDK über ein rauscharmes digitales TDM-Ausgangssignal (Time Domain Multiplexed) sowie über eine Empfindlichkeitstoleranz von ±1 dB. Über die TDM-Schnittstelle lässt sich ein Array von bis zu 16 Mikrofonen direkt an einen digitalen Mikroprozessor anschließen, ohne dass ein Codec notwendig ist, um die Daten zu verarbeiten und zu sequenzieren. Diese Geräte erzeugen in regelmäßigen Abständen Abtastwerte im Round-Robin-Verfahren. Möglich ist das durch die Verkettung der Wordclock-Ein- und -Ausgangssignale der einzelnen Mikrofone. In dieser Anordnung treibt ein von MCU oder DSP bereitgestelltes Basistaktsignal den Wordclock-Takt des ersten ICS-52000 an. Das Wordclock-Ausgangssignal treibt die Wordclock des zweiten ICS-52000 an usw. Der empfangende Prozessor muss lediglich jeden eingehenden Abtastwert dem geeigneten Puffer zuweisen. Das Bottom-Port-Design ist mit einem SMD-Gehäuse mit Maßen von 4 mm × 3 mm × 1 mm ausgestattet und umfasst den MEMS-Sensor, Signalkonditionierung und einen Analog-Digital-Wandler in Kombination mit Dezimations- und Anti-Aliasing-Filtern sowie passendem Energiemanagement.

Geringer Energieverbrauch

Für Systeme ausgelegt, die mit einem sehr geringen Energieverbrauch auskommen müssen, entlastet das MEMS-Mikrofon PMM-3738-1010 von PUI Audio den Host-Prozessor mithilfe einer Wake-on-Sound-Funktion wesentlich bei der Klangerkennung. Für einen Großteil der Zeit ist ein audiofähiges IoT-System mit Stille konfrontiert. Muss der Host-Prozessor jedoch in Aktion treten, um zu ermitteln, ob es sich bei eingehenden Audiosignalen um Sprachinhalte handelt, leidet die Batterielebensdauer des Systems. Gelöst werden kann dieses Problem durch die Integration eines simplen Frontend-Prozessors, der Audiosignale hinsichtlich ihrer Relevanz analysiert. Eine Frequenzanalyse kann beispielsweise feststellen, ob es sich beim eingehenden Signal um eine menschliche Stimme handelt. Meist wird das System jedoch sehr wenig hören.

Dank der Wake-on-Sound-Funktion des PMM-3738-1010 kann fast das gesamte System im Ruhezustand verharren, bis ein Audiosignal einen bestimmten Schalldruckpegel überschreitet. Mithilfe piezoelektrischer Technologie wird dabei der Ruhestromverbrauch auf ein Minimum reduziert. Aluminium-Nitrit, das als Beschichtung dient, erzeugt eine Spannung, wenn eine Schallwelle die Membran verformt. Da es keine Luftspalte gibt, entsteht keine akustische Dämpfung, die den Signal-Rauschabstand von Kondensatormikrofonen reduziert. Durch die Nutzung piezoelektrischer Elemente entstehen so Systeme mit geringem Energiebedarf, die eingehende Audiosignale kaum aktiv überprüfen müssen. Stattdessen kann die von einer eingehenden Schallwelle erzeugte Spannung genug Energie bereitstellen, um ein Signal zu erfassen und das Hochfahren der Wandlerschaltung einzuleiten.

Dank der Weiterentwicklung von Kondensator- und piezoelektrischer Technologie ist inzwischen eine große Bandbreite akustischer MEMS-Sensoren auf dem Markt erhältlich. Aufgrund des vielfältigen Angebots können Hersteller die Sensorparameter und das Energienutzungsprofil an eigene Anforderungen anpassen und ihre Designs mit einer noch besseren akustischen Wahrnehmung ihrer Umgebung ausstatten.

(prm)

Sie möchten gerne weiterlesen?