Durch den Einsatz Künstlicher Intelligenz (KI) lassen sich komplexe Wirkketten mit Querwirkungen diverser Steuergeräte umfassend und zeitsparend validieren. Dabei suchen selbstlernende Algorithmen gezielt nach kritischen Stimulationen, die zu Fehlern in der Wirkkette führen. Auf diese Weise ermöglicht die aleatorische (auf Zufall beruhende) Testmethode eine Absicherung über eine Vielzahl von Parameter- und Stimulationsräumen – unter anderem ein wichtiger Schritt in Richtung Autonomes Fahren. Der folgende Beitrag verdeutlicht am Beispiel der Absicherung von Rückfahrsystemen die Effizienz- und Qualitätssteigerung in der Funktionsabsicherung durch diese neue selbstlernende Methode.
Höhere Funktionsvielfalt gleichzeitig und gezielter testen
Automobilhersteller und deren Entwicklungspartner beschäftigen sich aktuell mit dem US-Gesetz FMVSS111. Es schreibt eine Rückfahrkamera bei allen ab Mai 2018 in den USA verkauften Pkws vor. Der Anforderung nach muss das Bild der Rückfahrkamera spätestens zwei Sekunden nach Einlegen des Rückwärtsgangs auf dem Bildschirm erscheinen und darf eine Überlagerung durch andere Anzeigen zu keinem Zeitpunkt erlauben. Die Absicherung von Rückfahrsystemen im Hinblick auf die neuen Vorgaben birgt viele Herausforderungen, da es sich bei dem Assistenzsystem um eine komplexe Wirkkette mit zahlreichen Querwirkungen handelt.
Um sicherzustellen, dass das Bild der Rückfahrkamera immer gesetzeskonform in der Anzeige erscheint, sind unzählige Signale und deren Auswirkungen auf das Gesamtsystem zu überprüfen (Bild 1). Beispiele für unerwünschte Querwirkungen sind die Anzeige einer Unwetterwarnung während der Rückwärtsfahrt oder eines Hinweises, dass der Akkustand des verbundenen Handys gering ist. Mit der Entwicklung einer neuen Absicherungsmethode auf Basis des Reinforcement Learnings (zielgerichtete Verstärkung des Lernens) – der aleatorischen Funktionsabsicherung – sorgt ASAP für die passende Lösung, denn mit ihr lassen sich Funktionen in weitaus höherer Vielfalt und gleichzeitig gezielter absichern als mit herkömmlichen Methoden.
Effizienz- und Qualitätssteigerung in der Funktionsabsicherung
Derzeit kommen manuelle Tests sowie Testautomatisierungen zum Einsatz, wenn es um die Absicherung der kontinuierlich steigenden Vielfalt und Komplexität von Funktionen geht. So erfolgt bei Testfahrten die Ausführung verschiedener Kundenfunktionen in zufälliger Reihenfolge, deren mögliche Fehler eine Aufzeichnung speichert. Gerade bei komplexen Wirkketten mit mehreren Steuergeräten im Verbund sind manuelle Erprobungen oder die Validierung mit Testautomatisierungen alleine nicht ausreichend, da sie extrem zeitaufwendig und entsprechend kostspielig sind und nicht die nötige Testtiefe erreichen.
Eckdaten
Mit der neuartigen aleatorischen Funktionsabsicherung auf Basis des Reinforcement Learnings unterstützt ASAP die Automobilentwickler beim Testen komplexer Systemfunktionen wie Fahrerassistenzsysteme. Selbstlernende Alogrithmen testen stichprobenartig die Wirketten von Steuergeräten sowie deren Querbeeinflussung und bewältigen gleichzeitig die überproportionale Zunahme an Vielfältigkeit und Komplexität von Fahrzeugfunktionen in einem akzeptablen Entwicklungszeitraum.
Neu entwickelt setzt die Methode der aleatorischen Funktionsabsicherung bereits vor der Erprobung im Fahrzeug an und bietet eine Lösung für die Herausforderungen der Absicherung: Durch den Einsatz künstlicher Intelligenz und das Testen an Closed-Loop-Prüfständen lassen sich komplexe Wirkketten mit Querwirkungen diverser Steuergeräte umfassend und zeitsparend validieren. Diese neue Testmethode sichert von vornherein die Integration von Funktionen im Fahrzeug besser ab und minimiert gleichzeitig den Bedarf an Testfahrten und -szenarien mit Prototypen auf diese Weise erheblich.
Die Vorteile der selbstlernenden Methode sind vielfältig. Im Gegensatz zum anforderungsbasierten Testen sind bei der aleatorischen Funktionsabsicherung vor Validierungsbeginn keine Testspezifikationen festzulegen – das beschleunigt den Entwicklungsprozess. Außerdem ist diese Art der Funktionsabsicherung nicht auf manuelle Eingaben angewiesen und kann folglich rund um die Uhr kostengünstig arbeiten. Im Gegensatz zum manuellen Testen, bei dem jeder Prüfer nur auf seinen persönlichen Erfahrungsschatz zugreifen kann, stehen die automatisch gelernten Zusammenhänge und Fehlerquellen für alle zukünftigen Absicherungen zur Verfügung. Eine weitere Besonderheit dieser neuen Funktionsabsicherung ist die automatische Generierung einer Datenbank, welche somit alle Ergebnisse dokumentiert. Hervorzuheben ist auch, dass Entscheidungen auf Basis von objektiven Kriterien erfolgen, dadurch erhöht sich die Testtiefe und somit der Validierungsgrad der getesteten Software.
Selbstlernende Methode zur Absicherung komplexer Wirkketten
Die genannten Vorteile machen die aleatorische Funktionsabsicherung zur optimalen Absicherungsmethode für komplexe Systeme mit vielen Querwirkungen. Beispielhaft seien hier Assistenzfunktionen beim Parken beziehungsweise bei der Rückwärtsfahrt genannt. Angefangen vom Gangwahlschalter über Motorsteuergeräte und Head Unit bis hin zum Kamerasystem sind eine Vielzahl von Steuergeräten Teil einer Wirkkette. Aus diesem Steuergeräteverbund ergeben sich zahlreiche Querwirkungen (Bild 2). So können beispielsweise Pop-ups zu Einstellungen oder Sicherheitsmeldungen das Bild der Rückfahrkamera überlagern. Im schlimmsten Fall könnte das Kamerabild durch Steuergerätefehler sogar ganz ausfallen.
Die Ursachen für Fehler können verschiedenste Eingabe-Kombinationen oder kritische Zustände von Steuergeräten sein. Da es unmöglich ist, alle Eingabe-Kombinationen mit unterschiedlichen Wartezeiten zu testen, setzt die aleatorische (auf Zufall beruhende) Funktionsabsicherung auf das Testen intelligent ausgewählter Stichproben. Vor Beginn des Tests sind zunächst Randbedingungen, Erwartungswerte und Stimulationsräume festzulegen. Unter Randbedingungen versteht man beispielsweise die gesetzlichen Vorgaben, dass der Fahrer das Bild auf eigenen Wunsch deaktivieren kann oder dass bei geöffnetem Kofferraum kein Bild der Rückfahrkamera in der Anzeige zu sehen ist, da sich die Kamera typischerweise in der Kofferraumabdeckung befindet. Der Erwartungswert beschreibt, welcher Zustand nach der Stimulation mit Eingabe-Kombinationen eintreten soll, und die Stimulationsräume legen fest, welche Eingaben zulässig sind.
Anschließend wählen Mustererkennungsverfahren gezielt Stichproben aus den verschiedenen Eingabe-Kombinationen. Dabei kommt ein selbstlernender Algorithmus – das Reinforcement Learning – zum Einsatz. Der Algorithmus führt kontinuierlich Aktionen aus, die den Zustand der Umwelt, also des Steuergeräteverbunds, verändern. Falls nach einer Aktion nicht der Erwartungswert eintritt, erhält der Algorithmus eine Belohnung für seine durchgeführten Aktionen. Das konditioniert ihn darauf, Abweichungen vom Erwartungswert in den Fokus zu nehmen, sodass der Algorithmus innerhalb des zur Verfügung stehenden Stimulationsraums nach Fehlern sucht (Bild 3).
Das Reinforcement Learning
Das Reinforcement Learning, eine zielgerichtete Verstärkung des Lernens, basiert auf der Annahme, dass für den aktuellen Zeitpunkt die Belohnung vom aktuellen Zustand sowie von der Aktion abhängt. Dabei sind die Lernrate und der Diskontierungsfaktor frei wählbare Parameter, die je nach Problemstellung und Anforderungen zu bestimmen sind.
Prinzipiell gibt es einen Zusammenhang zwischen der Lernrate und der Umgebung. Deterministische Umgebungen sind für die Lernrate optimal, da jeder gelernte Zusammenhang auch in Zukunft Gültigkeit hat. Je unberechenbarer die Umgebung ist, desto kleiner sollte dieser Parameter gewählt werden, um nur die wichtigsten Zusammenhänge zu lernen und seltenen Ereignissen nicht zu viel Gewicht zu verleihen. Gleichzeitig ist der Diskontierungsfaktor an die Dauer des Testlaufs anzupassen. Grundsätzlich gilt, je kürzer der Testlauf, desto kleiner der Parameter. Der Grund dafür ist, dass bei kleinen Werten die Suche verstärkt an problematischen Stellen erfolgt, während große Werte bewirken, den Suchraum umfassender zu durchsuchen. Zusammenfassend ergibt sich folgende Q-Funktion, die die erwartete Belohnung einer Aktion im Zustand beschreibt:
Die formale Beschreibung des Lernproblems ermöglicht es, gezielt nach Fehlern zu suchen, selbst wenn der Suchraum sehr groß ist. Dabei lassen sich die Parameter auch während der Laufzeit verändern, um die Fehlersuche weiter zu optimieren.
Testumgebung der aleatorischen Funktionsabsicherung
Die aleatorische Funktionsabsicherung benötigt einen Closed-Loop-Prüfstand, an dem alle relevanten Stimuli automatisiert ablaufen können. Unter Closed-Loop-Prüfstand versteht man die Eigenschaft, dass der real verbaute Steuergeräteverbund und die simulierte Umgebung sich gegenseitig beeinflussen (Bild 4). Im Rahmen der Fahrzeugentwicklung ist solch ein Laboraufbau auch als Labcar oder HIL bekannt. Beschleunigen die beteiligten Steuergeräte das Labcar virtuell auf eine bestimmte Geschwindigkeit, muss die simulierte Umgebung sich dementsprechend verändern und Rückmeldung über Steigungswinkel der Straße, Gegenwind und weitere Details an die entsprechenden Steuergeräte und Sensoren geben. Zudem muss die zu validierende Funktion ein eindeutiges Ergebnis haben. Insbesondere bei der Auswertung von Kundenfunktionen kommen typischerweise Algorithmen aus der Bildverarbeitung und des maschinellen Lernens zur Anwendung.
Ein Wegbereiter für das autonomes Fahren
Die Absicherung von Fahrfunktionen für autonomes Fahren stellt die Automobilindustrie vor neue Herausforderungen. Als Faustregel gilt, dass mindestens eine Million Testkilometer mit autonomen Fahrfunktionen zurückzulegen sind, bevor eine Freigabe erfolgen kann. Die neu entwickelte Methode der aleatorischen Funktionsabsicherung unterstützt dabei aktiv den Entwicklungsprozess. Mit ihr lassen sich in jeder Entwicklungsstufe automatisierte, realitätsnahe Tests ausführen und mögliche Fehler finden. Durch das gezielte Suchen nach Fehlern bekommt der Funktionsentwickler innerhalb kürzester Zeit ein Feedback zum aktuellen Entwicklungsstand.
Ein Beispiel für eine Funktion des Autonomen Fahrens ist etwa die Personenerkennung. Eine vollständige Spezifizierung zur Absicherung ist dabei nicht möglich, da es unendlich viele Situationen gibt, in denen Personen erkannt werden müssen. Eine Auswahl an Parametern, die sich ändern können und trotzdem zu einer fehlerfreien Erkennung der Person führen müssen, sind Größe, Bekleidung, Gehgeschwindigkeit der Person, Winkel zwischen Person und Auto, Lichtverhältnisse, Wetter, Straßenbelag und Objekte wie Bäume oder Schilder. Alle diese Parameter in sämtlichen Kombinationen zu evaluieren, ist schlicht unmöglich. An dieser Stelle hilft die von ASAP entwickelte Methodik, kritische Konfigurationen – wie beispielsweise schlechte Lichtverhältnisse – zu identifizieren und kann so einen großen Beitrag bei der Realisierung von Mobilitätslösungen der Zukunft leisten.
(jwa)