Besonders im Smart-Home profitiert das IoT von künstlicher Intelligenz. Entwicklern dieser Systeme hilft der Raspberry Pi dabei, diese Funktionalitäten zu implementieren.

Besonders im Smart-Home profitiert das IoT von künstlicher Intelligenz. Entwicklern dieser Systeme hilft der Raspberry Pi dabei, diese Funktionalitäten zu implementieren. (Bild: Farnell)

Das Internet der Dinge (IoT) verändert das Zuhause und macht es zu einem angenehmeren, effizienteren und sichereren Ort für Millionen von Eigenheimbesitzern. Unabhängig davon, ob es um die Steuerung von Klimaanlagen und Heizungen oder die Einstellung von Küchengeräten oder privaten Alarmanlagen geht, dank der Konnektivität von IoT-fähigen Geräten können Menschen ihr Zuhause von überall aus steuern.

Die Ergänzung von IoT-Lösungen um künstliche Intelligenz ermöglicht eine Vielzahl neuer erweiterter Funktionen. Mithilfe von Gesichtserkennung kann die private Alarmanlage erkennen, wer sich an der Tür befindet, sodass diese nur von Personen geöffnet werden kann, die das System „kennt“. In ähnlicher Weise bleibt die Spracherkennung nicht mehr nur auf mobilen Geräten, sondern ermöglicht es dem Eigenheimbesitzer, auch Leuchten, Fernseher und Wasserkocher allein durch Sprachbefehle zu steuern.

Seht mal, wer da spricht: Gesichts- und Spracherkennung

Gesichtserkennungstechnologie (FRT) ist der größte Fortschritt bei Sicherheitssystemen seit der Einführung von CCTV-Kameras und wird in der Regel verwendet, um Benutzer durch ID-Überprüfungsdienste zu authentifizieren. Sie kann ein menschliches Gesicht von einem digitalen Bild oder einem Videobild mit einer Datenbank von Gesichtern abgleichen und lokalisiert bzw. misst Gesichtsmerkmale in einem gegebenen Bild. Diese Technologie ist als solche in vergleichsweise kleinen Populationen in kontrollierten Umgebungen sehr erfolgreich.

Die Qualität des abzugleichenden Bildes ist ein entscheidender Faktor für die Leistung von FRT-Systemen. Ein weiterer Faktor ist die Umgebung – im Allgemeinen erzielt FRT bessere Ergebnisse, wenn ähnliche Umgebungsaspekte verglichen werden können, wie Hintergrund, Größe und Ausrichtung des Kopfes, Distanz zur Kamera und Lichtverhältnisse. Das Alter des Datenbankbildes ist ebenfalls von Bedeutung, da der Algorithmus besser funktioniert, wenn zwischen den zu vergleichenden Bildern weniger Zeit vergangen ist. Ferner wird die Leistung optimiert, wenn die Kamera, die das Datenbankbild der Person aufgenommen hat, ähnliche optische Eigenschaften aufweist wie die, die das Bild vor Ort erfasst.

Der Begriff Spracherkennung bezieht sich auf eine Reihe von Technologien, mit denen Computer gesprochene Worte erkennen können. Diese sind auch als automatische Spracherkennung (ASR), Computer-Spracherkennung oder Sprache-zu-Text (STT) bekannt. Einige Spracherkennungssysteme müssen „trainiert“ werden, wobei eine Person Text oder isolierten Wortschatz in das System liest. Das System analysiert die Stimme der Person und verwendet sie, um die Genauigkeit ihrer Erkennung des Gesagten dieser Person zu verbessern. In diesem Fall handelt es sich um sprecherabhängige Systeme, während Systeme, die kein Training verwenden, als „sprecherunabhängig“ bezeichnet werden.

Spracherkennungsanwendungen umfassen stimmliche Benutzerschnittstellen, wie Sprachwahl, Anrufweiterleitung, zum Beispiel, wenn der Anwender sagt: „Ich möchte ein R-Gespräch machen“, oder die Steuerung von Haushaltsgeräten. Ein bekanntes Beispiel für Spracherkennung im Alltag ist Alexa von Amazon. Wird nach dem Wetter oder den Fußballergebnissen gefragt, zeichnet die Lösung die Worte auf und sendet sie an die Server von Amazon, welche die Rechenleistung haben, um sie effizienter zu analysieren.

Die Wörter werden in einzelne Laute zerlegt, um sie dann mit einer Datenbank zu vergleichen. Danach wird entschieden, welche Wörter am ehesten dieser Kombination von Lauten entsprechen. Sobald das System eine Vorstellung von den Wörtern hat, wählt es die wichtigsten aus, um die Aufgabe zu verstehen. Wenn es beispielsweise Wörter wie „Regen“ oder „Temperatur“ erkennt, wird die Wetter-App geöffnet. Die Server senden die Informationen an Alexa zurück, die dann spricht, um dem Anwender mitzuteilen, was er wissen wollte.

Bei der Spracherkennung werden einzelne Wörter in Laute zerlegt und mit einer Datenbank verglichen. Danach wird entschieden, welche Wörter am ehesten dieser Kombination von Lauten entsprechen.
Bei der Spracherkennung werden einzelne Wörter in Laute zerlegt und mit einer Datenbank verglichen. Danach wird entschieden, welche Wörter am ehesten dieser Kombination von Lauten entsprechen. (Bild: AdobeStock_203881634)

Raspberry Pi und KI in Kürze

Leistungsstarke Algorithmen mit KI sind im IoT sehr wirkungsvoll. Der Beitrag beschreibt, was für die Implementierung dieser Technologie erforderlich ist, z.B. im Smart-Home-Bereich, sowie die dafür nötige Verarbeitung. Außerdem werden die Vor- und Nachteile der KI-Verarbeitung auf der Platine und in der Cloud diskutiert. Anhand des Raspberry Pi und über direkt verfügbare Tools sind die beschriebenen Techniken und Ansätze für eine breite Palette von Anwendungen einsetzbar.

KI in der Cloud oder lokal?

Die beiden wichtigsten Optionen für die Unterbringung des KI-Systems, das die Gesichts- oder Spracherkennungsdaten verarbeitet, sind die Cloud oder das IoT-Gerät selbst. Bei der lokalen Verarbeitung bietet die direkt in den Geräten integrierte Rechenleistung einen großen offensichtlichen Vorteil: sie reduziert die Latenzzeit – die Zeit, die Daten benötigen, um von der Quelle zum Ziel zu gelangen – und ermöglicht eine höhere Geschwindigkeit. Aufgrund dieser lokalen Verarbeitung ist keine Konnektivität erforderlich, aber je nach Anwendung kann viel mehr Rechenleistung auf dem IoT-Gerät notwendig sein. Es kann allerdings schwierig sein, ein solches System aus der Ferne zu aktualisieren, wobei Upgrades möglicherweise durch die Leistung der Hardware begrenzt sind. Ein zunehmend wichtigerer Aspekt ist die Sicherheit. Verteilte Datenverarbeitung bedeutet, dass weniger Daten an einen zentralen Server übertragen werden, was die Risiken reduziert. Darüber hinaus ist es einfacher, ein betroffenes Gerät „abzuschotten“.

Bei Cloud-Lösungen ist die Konnektivität für das Gerät ein Muss. Diese Methode reduziert den Bedarf an lokaler Verarbeitungsleistung und erleichtert Upgrades oder die Entwicklung der Algorithmen, wenn viele Geräte beteiligt sind. Der Nachteil ist, dass zusätzliche Kosten für den Service anfallen können und das Senden potenziell sensibler Daten an einen externen Standort mit Risiken verbunden ist.

Eine Zwischenlösung ist ein lokal basiertes Verarbeitungssystem neben der IoT-Hardware, was auch als Edge-Computing bezeichnet wird. Dabei senden mehrere IoT-Knoten Daten zur Verarbeitung an ein Edge-Gerät, was viele der Vorteile der direkten Verarbeitung auf dem Gerät bietet, jedoch die Notwendigkeit reduziert, dass jeder Knoten über eine leistungsstarke Rechenfunktion verfügen muss.

KI zum Selbermachen mit dem Raspberry Pi

Das Erstellen von Gesichts- und Spracherkennungsanwendungen ist mit einem Einplatinencomputer wie dem Raspberry Pi möglich. Zur Gesichtserkennung kann der Raspberry Pi Gesichter in einem Bild erkennen und ihre wichtigsten Merkmale in Echtzeit identifizieren und abbilden. Dadurch eignet er sich gut für Sicherheitsanwendungen in Innenräumen. Farnell hat ein Kit zusammengestellt, um die Erstellung von Gesichtserkennungsanwendungen einfacher zu gestalten. Das Kit besteht aus dem Raspberry Pi 4, der Raspberry-Pi-High Quality-Kamera und dem Automation HAT-Board von Pimoroni.

Der Raspberry Pi 4 ist eine Produktreihe kleiner Einplatinencomputer mit einem 64-Bit-Quad-Core-Arm-Cortex-A72-Prozessor (1,5 GHz), integriertem 802.11ac-Wi-Fi, Bluetooth 5, Full-Gigabit-Ethernet, zwei USB-2.0-Anschlüssen, zwei USB-3.0-Anschlüssen und Dual-Monitor-Unterstützung über zwei Micro-HDMI-Anschlüsse vom Typ D für eine Auflösung bis 4K. Der Pi 4 wird über einen USB-C-Anschluss mit Strom versorgt.

Die Raspberry-Pi-Kamera besteht aus einem Sensor der Produktreihe IMX477 von Sony mit einer Auflösung von 12,3 Megapixeln, der auf einer hintergrundbeleuchteten Sensorarchitektur basiert, mit einstellbarer Rückfokussierung und Befestigung für Objektive mit C- und CS-Fassung.

Automation HAT von Pimoroni verfügt über Relais, analoge Kanäle, Stromausgänge und gepufferte Eingänge (alle mit 24-V-Toleranz). Damit ist es für Smart-Home- und Automatisierungsprojekte geeignet.

Um die erfassten Bilder zu verarbeiten, müssen sie erst eine Erkennung durchlaufen. Ein Beispiel dafür ist die Umwandlung eines Bildes in Graustufen. Ein beliebtes Verarbeitungspaket ist OpenCV (Open-Source-Bildverarbeitungsbibliothek), das die Nutzung der maschinellen Wahrnehmung in kommerziellen Produkten beschleunigen und eine gemeinsame Infrastruktur für Computer-Vision-Anwendungen bieten soll.

OpenCV wird hauptsächlich in bildbezogenen Operationen verwendet und unterstützt Funktionen wie die Erkennung von Gesichtern und deren Eigenschaften, die Erkennung von Formen wie Kreisen und Rechtecken in einem Bild und die Erkennung von Text in Bildern wie Nummernschildern. OpenCV ist einfach erlernbar, funktioniert mit fast allen gängigen Sprachen und steht kostenlos zur Verfügung.

Ein weiteres Kit von Farnell bietet eine schnelle Möglichkeit für die Heimautomatisierung basierend auf Spracherkennung, um Haushaltsgeräte wie Lichter, Lüfter und Fernseher zu steuern. Die Lösung verwendet entweder ein Alexa-fähiges Mobilgerät oder einen Amazon Echo Dot und ein Raspberry-Pi-4-Board. Das Alexa-fähige Gerät nimmt Sprachbefehle an und schaltet damit jedes Haushaltsgerät über ein an das Raspberry-Pi-Board angeschlossenes Relais ein oder aus. Dieses virtuelle Kit enthält einen Raspberry Pi 4 und eine Pi-Relais-Platine.

Die Pi-Relais-Platine wird bevorzugt zur Steuerung von leistungsstarken Geräten wie Motoren und Leuchten verwendet. Sie bietet vier Relais und unterstützt Lasten bis 7 A/240 VAC, die für typische Haushaltsgeräte wie Glühbirnen, verschiedene LED-Leuchten und Lüfter geeignet sind. Auf der Platine enthaltene LEDs zeigen den Status jedes Relais an, während eine Stapel-Stiftleiste mit 40 Positionen für den Zugang zum RPi-GPIO verwendet wird. Jede Last, wie zum Beispiel eine Leuchte, lässt sich über das Relais anschließen und mit dem Raspberry Pi 4 steuern.

Alles zusammenbringen

KI bietet eine hohe Rechenleistung und leistungsstarke Algorithmen für IoT-Geräte und ermöglicht Heimanwendern fortschrittliche Steuerungs- und Sicherheitsanwendungen, die ihr Leben einfacher und sicherer machen. Die Verwendung einfach zu implementierender KI-Algorithmen auf einem kostengünstigen Einplatinencomputer wie dem Raspberry Pi ist eine gute Möglichkeit für den Entwickler dieser Systeme, die Technologie auszutesten und die Anwendungen zu optimieren. (na)

Ankur Tomar

Technical Marketing Manager bei Farnell

Sie möchten gerne weiterlesen?

Unternehmen

Farnell GmbH

Keltenring 14
82041 Oberhaching
Germany