Mit dieser Technologie soll das IC eine auf künstlicher Intelligenz basierte Datenverarbeitung im Edge Computing deutlich beschleunigen. Der Prototyp ist Teil des Forschungsprojekts „Updatable and Low Power AI-Edge LSI Technology Development“, das die New Energy and Industrial Technology Development Organization (NEDO) aus Japan in Auftrag gegeben hat.

Der Chip-Prototyp mit quantisiertem DNN bewältigt die Bilderkennung mit YOLO v3 bei 30 fps mit weniger als 5 W.

Der Chip-Prototyp mit quantisiertem DNN bewältigt die Bilderkennung mit YOLO v3 bei 30 fps mit weniger als 5 W. Socionext

Das IC verfügt über eine quantisierte DNN-Engine für die Inferenzverarbeitung bei hohen Geschwindigkeiten und niedrigem Stromverbrauch. Die meisten aktuellen Lösungen für das Edge Computing basieren auf herkömmlichen GPUs, die jedoch nicht in der Lage sind, die wachsende Nachfrage nach KI-basierten Verarbeitungsmethoden zum Beispiel in der Bilderkennung und -analyse zu bedienen. Unter anderem scheitern diese Schaltkreise am hohen Stromverbrauch und der starken Wärmeentwicklung.

Mehr Leistung, weniger Stromverbrauch

Die Lösung von Socionext reduziert die notwendigen Parameter- und Aktivierungsbits und liefert damit eine höhere Verarbeitungsleistung bei niedrigerem Stromverbrauch. Die Architektur ermöglicht neben den herkömmlichen 8-Bit-Verarbeitungen auch 1-Bit- und 2-Bit-Lösungen und enthält auch die Technologie zur Parameter-Komprimierung des Unternehmens. Damit sind eine große Menge an Berechnungen mit weniger Ressourcen und deutlich geringerer Datenmenge möglich.

Darüber hinaus hat das Unternehmen eine neuartige On-Chip-Speichertechnologie entwickelt, die eine effiziente Datenbereitstellung ermöglicht und den Bedarf an umfangreichem On-Chip- oder externen Speichers reduziert. Der Chip erreichte die Objekterkennung durch YOLO v3 mit 30 fps bei einem Stromverbrauch von weniger als 5 W. Ausgestattet ist das IC außerdem mit einer ARM-Cortex-A53-Quad-Core-CPU. Damit kann der Chip die gesamte KI-Verarbeitung ohne externe Prozessoren durchführen.

Zum Gesamtpaket gehört auch eine lernfähige Software-Entwicklungsumgebung. Mit Tensor Flow als Basis ermöglicht sie Entwicklern ein „Quantization-aware Training“ oder auch eine „Post-Training Quantization“. So können Anwender mit dem IC die optimale Quantisierungstechnologie für verschiedene neuronale Netze auswählen. Der Chip soll Computer-Vision-Funktionalitäten für Systeme bereitstellen bei kleinem Formfaktor und geringem Stromverbrauch. Zielanwendungen sind unter anderem Fahrerassistenzsysteme (ADAS), Sicherheitskameras und die Fabrikautomatisierung.