Der Edge-Inferenzprozessor Ergo soll mehr als 4 TOPS (Tera Operations Per Second) und 55 TOPS/W liefern und neuronale Netze bei einer Leistungsaufnahme von nur 20 mW verarbeiten können. Der Chip für künstliche Intelligenz ist das erste Produkt des erst kürzlich aus Xperi hervorgegangen Unternehmens Perceive.

Der Inferenzprozessor Ergo von Perceive liefert mehr als 55 TOPS/W und kann komplexe neuronale Netzwerke bei einer Leistungsaufnahme von nur 22 mW verarbeiten.

Der Inferenzprozessor Ergo von Perceive liefert mehr als 55 TOPS/W und kann komplexe neuronale Netzwerke bei einer Leistungsaufnahme von nur 22 mW verarbeiten. Perceive

Einsatzgebiete des Prozessors sind Sicherheitskameras, intelligente Geräte und Mobiltelefone. Der Ergo-Chip und die Referenzplatine werden derzeit für ausgewählte Anwender bemustert und sind im zweiten Quartal 2020 für die Massenproduktion bereit. Ergo soll es überflüssig machen, Sensordaten von der jeweiligen Anwendung in die Cloud zu schicken. Die Echtzeit-Inferenzbearbeitung findet mit dem Chip direkt auf dem Gerät statt und soll damit zum Verbraucher- und Datenschutz beitragen. Egal ob es um die Reduzierung von Falschmeldungen in einer Überwachungskamera geht, um die Verlängerung der Akkulaufzeit in mobilen Anwendungen oder die Vereinfachung der Benutzeroberfläche: Der Inferenzprozessor verbessert wichtige Funktionen der jeweiligen Anwendung, indem er das Verständnis und intelligente Reaktionen auf die Umgebung ermöglicht.

Komplexe Netzwerke laufen direkt auf Ergo

Perceive hat laut CEO Steve Teig neuartige mathematische Methoden für das Ziehen von Schlussfolgerungen entwickelt, die neu definieren, was in einem Edge-Gerät möglich ist. Es gibt eine wachsende Divergenz zwischen den begrenzten Fähigkeiten von Edge-Inferenzprozessoren oder sogar Anwendungsprozessoren und der steigenden Komplexität der fortschrittlichsten neuronalen Netzwerke, die bisher nur in Rechenzentren laufen konnten. Nun können jedoch auch hochentwickelte Netzwerke wie YOLOv3, M2Det und andere direkt auf Ergo laufen.

Zusammen mit dem Ergo-Inferenzchip bietet Perceive eine Komplettlösung für OEMs, einschließlich Referenzboards sowie Standard-Bildgebungs- und Audio-Inferenzanwendungen für gängige Inferenzaufgaben. Der Chip liefert mehr als vier GPU-äquivalente Fließkomma-TOPS mit der Fähigkeit, heterogene, große neuronale Netzwerke gleichzeitig ausführen zu können. Damit unterstützt er Anwendungen wie Video-Objekterkennung, Audio-Ereigniserkennung und Spracherkennung. Beispielsweise kann der Inferenzprozessor YOLOv3 mit bis zu 246 Bildern pro Sekunde bei einem Energieverbrauch von 20 mW laufen lassen.

Ergo unterstützt eine Vielzahl gängiger Arten von neuronalen Netzen für die Video- und Audioverarbeitung und auch für die Verarbeitung anderer Sensordaten, einschließlich CNNs (Convolutional Neural Networks), RNNs (Recurrent Neural Networks), LSTMs (Long Short-Term Memory) und andere.

Inferenz-Prozessor ohne externen RAM

Ergo benötigt keinen externen RAM und eigent sich aufgrund seines kleinen 7 × 7 mm² großen Gehäuses auch gut für den Einsatz in mobilen Geräten mit begrenztem Platz. Mit mehr als 55 TOPS/W erzeugt der Chip auch weniger Wärme. Hergestellt wird der Inferenzprozessor auf der 22FDX-Plattform von Globalfoundries.