Blaize entwickelte eine Computerarchitektur speziell für die Computing-Anforderungen und Komplexität von KI-Anwendungen, die sich speziell an die Segmente Automotive, Smart Vision und Enterprise Computing richtet. Dort arbeitet Blaize auch bereits mit verschiedenen Unternehmen an Pilotanwendungen. Die Graph-Streaming-Processor-Architektur (GSP) ermöglicht die gleichzeitige Ausführung mehrerer neuronaler Netze und kompletter Workflows auf einem einzigen System und unterstützt zugleich eine Vielzahl von heterogenen rechenintensiven Workloads.

Graphical Streaming Processor von Blaize

Nach Angaben von Blaize sollen die GSPs bis zu 100-mal effizienter sein als bestehende Lösungen. Blaize

Bei der GSP-Architektur von Blaize handelt es sich um eine voll programmierbare Prozessorarchitektur und Softwareplattform, die von Grund auf so konzi­piert ist, dass sie zu 100 Prozent Graphen-nativ ist. Aufgrund der inhärenten Graphen-nativen Struktur können Entwickler nun unter­schied­liche neuronale Netze und ganze Workflows auf einer einheitlichen Architektur aufbauen, die auf zahl­reiche Märkte und Anwendungsfälle anwendbar ist. Durch Integration von nicht-neuronalen Netzwerkfunktionen mit neuralen Netz­werk­funk­tionen lassen sich End-zu-End-Anwendungen mit neuronalen Netzwerkfunktionen erstellen, die das System dann alle als Graphen darstellt. KI-Anwen­dungsentwickler können damit komplette Anwendungen schneller erstellen, diese für die Einsatz­bedingungen am Netz­werk­rand optimieren und mithilfe automatisierter Datenstreaming-Methoden effizient ausführen.

Die Lösung von Blaize kombiniert dynamische Datenflussmethoden und Graph-Computing-Modelle mit vollständig programmierbaren proprietären SoCs. Dies ermöglicht es Blaize-Computerplattformen, die native Graphenstruktur, die den Workloads neuronaler Netzwerke innewohnt, während der gesamten Laufzeit zu nutzen. Der Effizienzmultiplikator wird über einen Daten-Streaming-Mechanismus bereitgestellt, der nicht-rechnerische Datenbewegungen minimiert oder eliminiert. Das minimiert die Latenzzeit von Blaize-Systemen und reduziert sowohl den Speicherbedarf als auch den Energiebedarf auf Chip-, Board- und Systemebene.