Bildergalerie
Bild 1: Die Elemente eines Infotainment-Systems mit Sprachbedienung.
Bild 2: Typischer Ablauf bei der automatischen Spracherkennung.
Bild 3: Die Sprachbiometrie ermöglicht die individuelle Anpassung des Fahrzeug(profil)s anhand der persönlichen Sprachmerkmale („Fingerabdruck“ der Sprache) des Fahrers bis hin zur Sicherung gegen unbefugte Nutzung.

Kein Autofahrer möchte heute darauf verzichten, seine Lieblingsmusik während der Fahrt auszuwählen. Hinzu kommen mittlerweile aber auch die vielen Anwendungen und Dienste, die wir von unserem Smartphone kennen und die unseren Alltag einfacher und unterhaltsamer gestalten. Gerade weil sie uns ständig auf dem Laufenden halten und uns mit unseren Freunden verbinden, möchten viele sie auch während der Fahrt nicht missen. Laut einer Untersuchung von Gartner Group schätzt Gartner Analyst Thilo Koslowski, dass im Jahr 2016 bereits 60 % der Autofahrer von ihrem Fahrzeug vernetzte Funktionen erwarten und dieser Anteil bis 2021 sogar auf über 85 % steigt.

Dragon Drive (ID)

… schließt die Lücke zwischen Sprachbedienung, Onboard-Anwendungen sowie vernetzten Diensten von externen Anbietern. Die neue Plattform bietet Automobilherstellern eine integrierte Lösung, die Spracherkennung und Sprachverstehen, intelligente Dialogführung, ausdruckstarke Sprachausgabe, automotive Vernetzung, Apps, Dienste und dynamische Verwaltung der Nutzer sowie Dienste aus einer Hand verbindet. Mithilfe eines sogenannten Voice Print lässt sich nicht nur der Zugang zu persönlichen Daten sichern, sondern es besteht beispielsweise auch die Möglichkeit, Fahrzeugeinstellungen dem Profil des jeweiligen Fahrers anzupassen oder auch das Fahrzeug gegen unbefugte Nutzung zu sichern.

Aber wie sieht es mit der Bedienung aus? Wie kann man gewährleisten, dass der Fahrer die Vielfalt an Funktionen und Diensten, die in einem vernetzen Fahrzeug theoretisch möglich sind, auch praktisch und sicher verwenden kann?

Integrierte Schnittstellen

Erste Voraussetzung für eine anwenderfreundliche Bedienung ist eine einheitliche Schnittstelle, die die verschiedenen Plattformen und Quellen von Informationen, Daten und Diensten integriert. Ein Autofahrer hat in einem modern ausgestatteten Fahrzeug eine Vielzahl von Geräten und Plattformen, die er verwenden kann beziehungsweise kombinieren muss, um genau die Dienste nutzen zu können, die er sich wünscht. Hierzu gehören klassische Headunit-Anwendungen wie Onboard-Navigation aber auch Headunit-Anwendungen mit Internetanbindung, beispielsweise für eine Online-Sonderzielsuche (Online-POI). Auch vom Autohersteller bereitgestellte optionale Anwendungen, die der Fahrer sich mal auf die Headunit, mal auf sein Smartphone laden kann (zum Beispiel News-Services- oder Musik-Streaming-Dienste ins Auto) oder gewohnte Smartphone-Apps, die der Fahrer auch während der Fahrt nutzen möchte, gehören dazu. Derartige Apps, zum Beispiel eine Wetter-App, können wahlweise auch im sogenannten Car-Modus sein.

Die Herausforderung für die Automobilhersteller und deren Lieferanten besteht darin, eine einheitliche Lösung anzubieten, die die verschiedenen Quellen und Geräte integriert. Laut einer Studie von IHS 2 erwarten über 30 % aller Konsumenten, dass ihre Apps auf dem Fahrzeugdisplay angezeigt werden. Bei denjenigen, die bereits ein Smartphone besitzen, ist die Anzahl mit 40 % sogar noch höher.

Die Dragon-Drive-Plattform von Nuance ermöglicht erstmals solch eine einheitliche und integrierte Sprachbedienung für die verschiedenen vernetzten Systeme im Auto.

Entscheidende Faktoren für die Akzeptanz von Spracherkennung im Auto

Neben der Integration der verschiedenen Geräte, Quellen und Dienste hat sich auch der Funktionsumfang deutlich erweitert. So kann der Autofahrer mit freien Formulierungen heute Kontakte aus dem Mobiltelefon-Adressbuch anrufen, Musik suchen, Zieladressen nennen oder sogar E-Mails diktieren.

Verschiedene Faktoren sind ausschlaggebend für den Erfolg von Sprachbedienung und die Akzeptanz durch den Anwender:

  • Hervorragende Erkennungsgenauigkeit
    Fehlerkennungen und damit verbundene Korrekturen können auch immer zur Ablenkung des Fahrers führen. Heutige Systeme können zuverlässig hunderttausende von Wörtern erkennen. Nicht zuletzt wird diese Verbesserung durch größere Rechenleistung der heutigen Hardware, der Vernetzung mit serverbasierten Systemen sowie der Optimierung der eingesetzten Algorithmen bewirkt.
  • Sehr gute Signalverarbeitung
    Im Auto gelten für Spracherkennung spezielle Herausforderungen. Fahr- und Hintergrundgeräusche erschweren die Erkennung. Außerdem spricht der Fahrer nicht direkt in das Mikrophon. Die Auswahl und Platzierung guter Far-Talk-Mikrophone spielt eine große Rolle für die Qualität der Spracherkennung.
  • Natürliches Sprachverstehen
    Moderne Spracherkennungssysteme erkennen nicht nur die Wörter, die der Anwender spricht, sondern verstehen und interpretieren mittlerweile auch die Bedeutung einer Aussage. Die Äußerung „Ich habe Hunger“ interpretiert das System als Suche nach einem Restaurant in der Nähe, sodass eine fest definierte Kommando-Struktur damit überflüssig wird: Der Anwender teilt dem Auto in natürlicher Sprache seine Intention mit. Das Sprachverstehen extrahiert aus den Äußerungen die relevanten Informationen wie zum Beispiel Straßen- oder Städtenamen. Fehlende Informationen fragt das System in einem intelligenten Dialog ab. Insbesondere für neue unerfahrene Anwender ist diese Flexibilität der Eingabe wichtig.
  • Mehrsprachigkeit
    Ein gutes Sprachsystem unterstützt sowohl bei der Spracheingabe als auch bei der Sprachausgabe Multilingualität. Auch wenn der Anwender in der Regel eine Bediensprache auswählt, so werden häufig englische oder anderssprachige Musiktitel ausgewählt, Navigationsziele im Ausland eingegeben oder Personen mit ausländischen Namen angerufen. Häufig besteht eine Äußerung also aus Elementen in verschiedenen Sprachen. Daher sollte der Erkenner auch Laute (Phoneme) anderer Sprachen verarbeiten und bei dynamischen Inhalten auch mittels Sprachschätzung bestimmen können, in welcher Sprache zum Beispiel ein Musiktitel vorliegt.
  • Intelligentes Dialogsystem
    Es genügt nicht nur zu verstehen, was gesprochen wurde. Das Dialog-System sollte auch Informationen aus allen möglichen Systemkomponenten in Betracht ziehen, wie beispielsweise die Anwendung und der Kontext, in der sich der Sprecher gerade befindet. Dadurch kann es zum Beispiel eine Eingabe wie „The Smiths“ als Musik erkennen, statt in das Adressbuch zu springen. Das System sollte auch relevante Verbindungen, wie „Meine Frau“ lernen können, um täglich eingesetzte Begriffe auf natürliche Weise abzurufen.
  • Natürlich klingende Sprachausgabe
    Ein weiteres wichtiges Kriterium ist eine angenehme, freundliche und vor allem gut verständliche Sprachausgabe des Gesamtsystems, um dem Fahrer nicht zu viel kognitive Last während des Autofahrens abzuverlangen. Mit einer angenehmen Prosodie ist selbst längeren Ausgaben wie zum Beispiel dem Vorlesen von E-Mails einfach zu folgen.

Die enge Verknüpfung von Sprache und Inhalten ist Voraussetzung für eine optimale Bedienung. Zum einen reicht es nicht aus, eine Smartphone-Anwendung einfach auf dem Headunit-Display anzuzeigen und mit einem Sprachkommando aufzurufen. Der Inhalt sollte für den Fahrer anders strukturiert werden. Die Anwendung sollte differenziert auf die Äußerungen des Fahrers eingehen, gegebenenfalls nachfragen und fehlende Informationen erfassen. Zum anderen ermöglicht die enge Verknüpfung von Sprache und Inhalten eine bessere Erkennung und natürlichere Dialoge, da Wortschatz und Kontext dem Spracherkenner bekannt sind und ständig angepasst werden.

Das Unternehmen Nuance hat seine automotive Sprachplattform Dragon Drive kürzlich um eine Dienste-Plattform erweitert und schließt damit die Lücke zwischen Sprachbedienung, Onboard-Anwendungen sowie vernetzten Diensten von externen Anbietern. Die neue Plattform bietet Automobilherstellern eine integrierte Lösung, die Spracherkennung und Sprachverstehen, intelligente Dialogführung, ausdruckstarke Sprachausgabe, automotive Vernetzung, Apps, Dienste und dynamische Verwaltung der Nutzer und Dienste aus einer Hand verbindet. Zum gegenwärtigen Zeitpunkt zählen die zehn weltweit führenden Autobauer zu den Kunden von Nuance. Mehr als neunzig Millionen auf den Straßen rollende Fahrzeuge sind mit der Spracherkennungs- und Sprachausgabetechnologie des Unternehmens ausgerüstet. Die Verfügbarkeit von Dienstplattformen, wie Dragon Drive wird die Akzeptanz von On-Board-Funktionen der Spracherkennung und Umwandlung von Text in Sprache weiter beschleunigen. Für Automobilhersteller wird es sogar einfacher werden, für ihre Produkte geeignete Anwendungspakete und getestete Benutzeroberflächen zu erwerben, die sich trotzdem vollständig in ihre eigenen HMI integrieren oder mit den von ihnen gewünschten Funktionen erweitern lassen.

Persönliche Assistenten

Persönliche Assistenten, wie man sie aus Smartphones kennt, können auch dem Fahrer großen Nutzen bieten – auch hier vorausgesetzt, dass ihre Bedienung den Bedürfnissen des Autofahrers angepasst ist. Persönliche Assistenten kennen das Profil und die Historie des Fahrers. Sie können verschiedene Informationsquellen kombinieren, um den Fahrer optimal zu unterstützen. Dafür kombinieren sie Kontaktdaten, Kalender, Navigation, Verkehrsdaten sowie Informationen aus sozialen Netzwerken. Der Fahrer erhält nun kontext- und situationsabhängig aktiv genau die Informationen, die zum jeweiligen Zeitpunkt relevant sind. Entsprechend könnte ein persönlicher Assistent im Auto den Fahrer darauf hinweisen, dass es auf der Strecke zu seinem nächsten Termin einen Unfall gegeben hat und eine alternative Route vorschlagen. Er könnte auch anbieten, eine Nachricht zu verschicken, um die Verspätung des Fahrers anzukündigen. Hier würde der Assistent Informationen aus dem Terminkalender des Fahrers, der Navigation, den gespeicherten Kontakten sowie der Verkehrsmeldungen kombinieren.

Sprachbiometrie

Die zunehmende Verfügbarkeit von Internet im Fahrzeug bietet Autofahrern unzählige Möglichkeiten, auch vom Auto aus Zugang zu persönlichen Daten, E-Mails oder sozialen Netzen zu haben. Damit steigt auch das Bedürfnis, diese Daten gegen den Zugriff anderer Personen zu schützen, die unter Umständen das gleiche Fahrzeug nutzen. Auch wenn Car-Sharing immer beliebter wird, möchte niemand seine persönlichen Daten teilen. Die gesonderte Anmeldung zu jedem Service und jeder App kann allerdings umständlich sein, insbesondere während der Fahrt. Für gewöhnlich müssen sich Anwender verschiedene Passwörter einprägen, die oftmals aus kryptischen Buchstaben-, Zahlen- und Zeichenkombinationen bestehen, was sich viele kaum merken können. Sprachbiometrie ermöglicht es, einen Anwender anhand seiner Stimmmerkmale eindeutig und auf sehr bequeme Weise zu identifizieren. Mithilfe eines sogenannten Voice Print lässt sich nicht nur der Zugang zu persönlichen Daten sichern, sondern es besteht beispielsweise auch die Möglichkeit, Fahrzeugeinstellungen dem Profil des jeweiligen Fahrers anzupassen oder auch das Fahrzeug gegen unbefugte Nutzung zu sichern. Um genau dies zu gewährleisten, bietet Nuance seinen Automobilkunden die Sprachbiometrie-Software Dragon ID in Ergänzung zur Dragon-Drive-Plattform an.

Sprachbiometrie kommt bereits in anderen sicherheitskritischen Bereichen wie zum Beispiel bei Banken erfolgreich zum Einsatz. Diese Art der Benutzeridentifizierung ist auch sehr robust gegenüber typischen Varianzen in der Stimme wie Tageszeit, Gesundheitszustand, aber auch gegenüber Hintergrundgeräuschen. Die Stimme des Nutzers aufzunehmen, führt außerdem nicht zur Verifizierung, da durch die Aufnahme individuelle Stimmmerkmale verändert werden. Die Technologie weist ein solches Stimmenmuster zurück.

Ausblick: Das vernetzte Auto der Zukunft

Der Erfolg vernetzter Autos hängt davon ab, wie sehr es der Branche gelingt, für den Autofahrer relevante Dienste und Sprachbedienung reibungslos in das Auto zu integrieren, die Gefahren durch Fahrerablenkung zu minimieren sowie Nutzen und Spaß für den Fahrer zu garantieren. In Zukunft werden die Bedienschnittstellen nicht nur vernetzt sein sondern intelligent, personalisiert und verschiedene Modalitäten unterstützen. Sprache, Bewegung, Touch, Biometrie, Handschrifterkennung und andere Ein- und Ausgabemodalitäten werden miteinander integriert und bieten dem Anwender eine flexible optimierte Bedienung. Automotive-Dienste und Anwendungen werden in hohem Maße personalisiert sein, und somit dem Profil, der Bewegung und den Vorlieben des Fahrers angepasst.

Weiterhin werden persönliche Einstellungen und Profile über verschiedene Geräte und Fahrzeuge hinweg verfügbar sein. Autofahrer können die gleiche vertraute Bedienung auf ihrem Smartphone, Fernseher oder in einem anderen Fahrzeug erwarten, da ihre Profile und Daten über die Cloud verfügbar sind. Nuance hat zum Beispiel mit Dragon ein Sprachbedienkonzept entwickelt, das von den führenden Herstellern von Fahrzeugen, Smartphones, Fernsehern und Computern unterstützt wird und eine einheitliche Bedienung über verschiedene Plattformen ermöglicht. Zugleich ist es flexibel genug, um jedem Hersteller seine eigene Identität zu gewähren.