Wird ein neuronales Netz mit Licht anstelle von Elektrizität betrieben, lassen sich großer Energieeinsparungen erzielen und die Leistung dabei sogar steigern.

Wird ein neuronales Netz mit Licht anstelle von Elektrizität betrieben, lassen sich großer Energieeinsparungen erzielen und die Leistung dabei sogar steigern. (Bild: Adobe Stock - Yeti Studio)

Künstliche Intelligenz (KI) bringt in vielen Bereichen schnelle Fortschritte, so zum Beispiel auch bei der industriellen Bildverarbeitung im Rahmen der Automatisierung. Ein Problem dabei ist aber der große Energiebedarf von KI. Nach Schätzungen von Experten könnte dadurch der aktuelle Energiebedarf von Rechenzentren, der heute etwa bei 5 Prozent des weltweiten Energieverbrauchs liegt, innerhalb weniger Jahre auf bis zu 30 Prozent ansteigen.

Ralf Herbrich, Geschäftsführer des Hasso-Plattner-Instituts (HPI) in Potsdam und Leiter des Fachgebiets Künstliche Intelligenz und Nachhaltigkeit, verdeutlicht das Problem mit einem Vergleich: Für das Training eines KI-Modells müssten die Prozessoren hunderter Grafikkarten, die jeweils etwa 1000 Watt verbrauchten, für mehrere Wochen laufen: "1000 Watt ist so viel wie ein Backofen verbraucht."

Wie lässt sich der Stromhunger der KI zähmen?

Mikroskopische Aufnahme eines 5x5 VCSEL-Arrays (in der Bildmitte) in der Anwendung als optischer neuromorpher Computer.
Mikroskopische Aufnahme eines 5x5 VCSEL-Arrays (in der Bildmitte) in der Anwendung als optischer neuromorpher Computer. (Bild: Zaijun Chen, MIT)

Eine Möglichkeit liegt darin, statt elektrischem Strom für den Betrieb von KI-Systemen Licht zu verwenden. Ein Forschungsteam der TU Berlin und des Massachusetts Institute of Technology (MIT) in den USA hat jetzt den weltweit ersten Chip entwickelt, auf dem mithilfe eines VCSEL-Lasersystems das neuromorphe Rechnen mit Licht realisiert wird. Die Chiparchitektur bildet dabei ein „neuronales Netz“, eine Methode der Künstlichen Intelligenz (KI), die sich am menschlichen Gehirn orientiert und zum Beispiel der Anwendung ChatGPT zugrunde liegt. Erste Experimente ergaben, dass der Chip 100-mal energieeffizienter ist und 20-mal mehr Rechenpower pro Fläche besitzt als die besten elektronischen Digitalprozessoren.

Warum ist Licht effizienter?

Der Grund dafür ist ein physikalisches Limit: Die zentralen Bausteine von Mikrochips, die Transistoren, lassen sich aus thermodynamischen Gründen nicht beliebig schnell und gleichzeitig energieeffizient schalten. „Die besten kommerziell erhältlichen Chips haben dieses Limit praktisch schon erreicht“, sagt Prof. Dr. Stephan Reitzenstein, Leiter der Arbeitsgruppe „Optoelektronik und Quantenbauelemente“ an der TU Berlin. Diese physikalische Grenze für die auf Stromfluss basierenden Mikrochips schränke auch die Entwicklung von KI-Anwendungen fundamental ein, erklärt Reitzenstein. „Um etwa mächtigere neuronale Netze zu bauen, können wir nicht einfach mehrere Supercomputer zusammenschalten. Wir brauchen dazu ein kompaktes, leistungsfähiges Gesamtsystem.“

Die Wissenschaft hat bereits einen Ausweg gefunden: Weltweit forschen Arbeitsgruppen am Rechnen mit Licht. Statt Elektronen werden dabei Lichtteilchen, die Photonen, durch lichtleitende Materialien und Strukturen in den Chips geleitet. Durch physikalische Effekte können sie sich gegenseitig beeinflussen und so mathematische Operationen mit hoher Geschwindigkeit und auf kleinstem Raum ermöglichen. Darüber hinaus kann Licht aufgrund einer höheren Bandbreite sehr viel mehr Informationen gleichzeitig transportieren.

Für die KI besonders interessant sind optische neuronale Netze (ONN). Bei ihnen werden die künstlichen Neuronen bereits als Strukturen auf dem optischen Chip angelegt.

Bessere optische neuronale Netze mit kompaktem Laser

Bislang gab es bei den ONN allerdings mehrere Herausforderungen. So war die Umwandlung von elektrischen Eingangssignalen in Licht sehr energieaufwändig. Zudem waren die verwendeten Laser – im Gegensatz zu den optischen Strukturen – verhältnismäßig groß und benötigten daher zu viel Raum. Und schließlich waren die optischen Rechner bei bestimmten mathematischen Operationen nicht so stark. „All diese Probleme konnten wir mit der Verwendung eines VCSEL-Lasersystems lösen“, berichtet Stephan Reitzenstein.

 

Stichwort: VCSEL-Laser

Ein VCSEL (Vertical cavitiy surface emitting laser) ist eine Laserdiode, bei der das Licht in einem kegelförmigen Strahl vertikal von der Oberfläche eines Wafers abstrahlt. VCSEL bieten viele Vorteile im Vergleich zu herkömmlichen kantenemittierenden Lasern, bei denen Licht an einer oder zwei Flanken des Chips austritt. Die Miniatur-Laser sind nur etwa zehn Mikrometer im Durchmesser groß (ein Hundertstel Millimeter) und schichtartig aufgebaut. „Ein Laser erzeugt seine energiereichen und parallelen Lichtstrahlen dadurch, dass er sie mit Spiegeln mehrfach durch einen Resonatorraum mit einem optisch aktiven Medium schickt. Ein VCSEL besitzt mehrere Schichten von teilreflektierenden Materialien, die zusammen fast alle Lichtstrahlen wieder in den Resonator zurückspiegeln – dadurch ist er sehr energieeffizient“, erklärt Reitzenstein. Zudem kann ein VCSEL in einem „nichtlinearen“ Zustand betrieben werden, in dem er sehr empfindlich selbst auf kleinste Eingangsimpulse reagiert und damit für alle mathematischen Herausforderungen gerüstet ist.

Das Youtube-Video beschreibt die Funktionsweise eines VCSEL-Lasers.

VCSEL werden heute bereits als Lichtquelle in Telekommunikationsnetzen und zur Gesichtserkennung in Smartphones eingesetzt - sie wurden an der TU Berlin mitentwickelt und haben bereits zu erfolgreichen Ausgründungen geführt. „Aufbauend auf diesem Know-how haben wir die VCSEL für den Einsatz in einem ONN-Chip angepasst und optimiert“, sagt Reitzenstein. Dabei galt es, eine möglichst hohe Lichtausbeute zu erreichen und die Anordnungen von jeweils 25 VCSEL auf einem Chipsegment auf eine exakt gleiche Lichtwellenlänge zu bringen.

Erste Tests mit überragenden Ergebnissen

In Zusammenarbeit mit der Arbeitsgruppe von Dirk Englund am MIT in Boston, deren Forschende bereits 2019 das Konzept für die Anwendung der neuen Chips im neuromorphen Computing theoretisch beschrieben hatten, wurden erste Experimente mit den neuen ONN durchgeführt. Als Testaufgabe für die KI wählte das Team die Erkennung von handgeschriebenen Zahlen. Das Ergebnis: Die neuen Chips sind 100-mal energieeffizienter und können 20-mal mehr Rechenpower pro Fläche bereitstellen als die besten elektronischen Digitalprozessoren.

„Durch eine relativ leicht zu realisierende Erhöhung der Taktfrequenz der Laser könnten diese Werte vermutlich noch einmal um den Faktor 100 gesteigert werden“, erklärt Stephan Reitzenstein. Bis KI auf Basis dieser Erfindung tatsächlich in Smartphones eingebaut werden kann oder Anwendungen wie ChatGPT einen Sprung in der Leistungsfähigkeit ermöglicht, müssen jetzt allerdings diese im Bereich der Grundlagenforschung gewonnenen Ergebnisse industriell umgesetzt werden. Da von den Forschenden aber nur etablierte Herstellungsverfahren für ihre Prototypen benutzt wurden, sollte dies in wenigen Jahren möglich sein.

Sie möchten gerne weiterlesen?