DNA-100-Prozessor

Die Funktionsweise des DNA-100-Prozessors im Automotove-Umfeld. Cadence

Neuronale Netze kommen in autonomen Fahrzeugen sowie für ADAS-, Überwachungs-, Roboter-, Drohnen-, Augmented- /Virtual Reality-, Smartphone-, Smart-Home- und IoT-Anwendungen zum Einsatz. Sie lassen sich durch inhärente „Sparsity“ sowohl hinsichtlich der Gewichtungen als auch der Aktivierungen charakterisieren. (Eine Sparse Matrix ist eine Matrix, in der die Mehrzahl der Elemente Null ist.) Dies bewirkt, dass die MACs in anderen Prozessoren unnötigerweise durch das Laden und Multiplizieren von Nullen beschäftigt werden. Die spezielle Hardware Computer-Engine des DNA-100-Prozessors vermeidet beide Aufgaben, sodass die Sparsity für die Leistungseffizienz und zur Reduzierung des Rechenaufwands genutzt werden kann. Das Trainieren von neuronalen Netzen im Hinblick auf neue Inhalte bewirkt eine Erhöhung der Sparsity in den Netzwerken; so lässt sich eine bestmögliche Performance der Sparse Compute Engine des DNA 100 Prozessors erreichen. Auf diese Weise kann der DNA-100-Prozessor den größtmöglichen Durchsatz mit einem kleineren Array erreichen. Dies wird durch seine Fähigkeit verdeutlicht, bis zu 2550 Frames pro Sekunde (fps) und bis zu 3,4 TMACs/W (bei 16-nm-Technologie) geschätzter On-Device-Inferenz-Leistung auf Resnet 50 für eine 4K-MAC-Konfiguration zu erreichen.

Der DNA-100-Prozessor ist mit einer vollständigen Softwareplattform für Künstliche Intelligenz ausgestattet. Die Kompatibilität mit der aktuellen Version des Tensilica-Neural-Network-Compilers ermöglicht die Unterstützung von Frameworks für Künstliche Intelligenz. Dazu zählen etwa Caffe, Tensorflow, Tensorflow Lite und einem breiten Spektrum von neuronalen Netzen einschließlich Convolution- und Recurrent-Netze. Dadurch ist der DNA-100-Prozessor geeignet für On-Device-Inferenz für Vision-, Sprach-, Radar-, Lidar- und Kommunikationsanwendungen. Der Tensilica-Neural-Network-Compiler nutzt zahlreiche optimierte Bibliothek-Funktionen für neuronale Netze, um das neuronale Netz in ausführbaren und hoch optimierten Hochleistungscode abzubilden. Auf diesen Weise verfügt der DNA-100-Prozessor über eine robuste Softwareökosystem-Unterstützung für verschiedene Netztypen, einschließlich Klassifikation, Objekterkennung, Segmentation, Rekurrenz und Regression. Der Prozessor unterstützt auch das Android Neural Network (ANN) API für eine On-Device-AI-Inferenz in Geräten mit Android-Betriebssystem.

Alle Ebenen von neuronalen Netzen

Nicole Ahner

Lazaar Louis, Senior Director of Product Managements and Marketing für Tensilica IP bei Cadence, bei der Vorstellung des DNA-100-Prozessors.

Nicole Ahner

Der Prozessor kann alle Ebenen von neuronalen Netzen ausführen, einschließlich Convolution, voll vernetzt, LSTM, LRN und Pooling. Ein einzelner DNA-100-Prozessor lässt sich von 0,5 bis 12 effektiven TMACs skalieren. Mehrere DNA-100-Prozessoren lassen sich koppeln, um Hunderte TMACs für den Einsatz in sehr rechenintensiven On-Device-Neuronalen-Netzanwendungen zu erreichen. Der Prozessor beinhaltet auch einen Tensilica DSP, um alle neuen Ebenen von neuronalen Netzen abzudecken, die derzeit nicht von den Hardware-Engines im DNA-100-Prozessor unterstützt werden. Außerdem ermöglicht der DSP eine Erweiterbarkeit und Programmierbarkeit des Tensilica Xtensa Cores durch die Verwendung der Tensilica Instruction Extension (TIE) Befehle. Da der DNA-100-Prozessor über einen eigenen DMA (Direct Memory Access) verfügt, kann er auch anderen Steuercode ausführen, ohne dass ein zusätzlicher Controller benötigt wird.

„Die Inferenz-Anforderungen der neuronalen Netze unserer Kunden decken ein breites Spektrum ab, sowohl im Hinblick auf die AI-Verarbeitung als auch auf die Arten der neuronalen Netze“, sagt Lazaar Louis, Senior Director of Product Managements and Marketings für Tensilica IP bei Cadence. „Daher wird eine skalierbare Architektur benötigt, die ebenso effektiv in einfachen IoT-Anwendungen wie auch in anspruchsvollen Automobilanwendungen arbeitet, und die mehrere zig oder sogar Hunderte TMACs erfordert.“ Der DNA-100-Prozessor soll ab Dezember 2018 für ausgewählte Kunden erhältlich sein; allgemein verfügbar wird er wohl im ersten Quartal 2019 sein.