Stromversorgungen für  den immensen Datenverarbeitungsaufwand, wie er in Hyperscale-Rechenzentren auftritt, müssen bestimmte Anforderungen erfüllen.

Stromversorgungen für den immensen Datenverarbeitungsaufwand, wie er in Hyperscale-Rechenzentren auftritt, müssen bestimmte Anforderungen erfüllen. (Bild: Gorodenkoff @ AdobeStock)

Da die Leistungspegel von KI-Hochleistungsprozessoren weiter steigen und die Core-Spannungen mit fortschrittlichen Halbleiterprozessen sinken, müssen Stromversorgungssystemen immer größere Impedanzspannungsabfälle im PDN, Spannungsgradienten über Hochstrom- und Low-Voltage-Prozessor-Stromversorgungskontakte, Transientenverhalten und Leistungsverluste bewältigen. Im Fall von Cluster-Computing, bei dem dicht gepackte Arrays von Prozessoren die Leistungsfähigkeit des maschinellen Lernens steigern, nimmt die Komplexität des PDN zu, denn die Stromzufuhr muss vertikal von der Unterseite des Arrays erfolgen.

FPA mit PoL-Leistungswandlern

Ein PDN auf Basis der FPA von Vicor mit Stromvervielfachern am PoL (Point-of-Load) anstelle herkömmlicher Spannungs-mittelung bewirkt einen erheblichen Leistungssprung. Ermöglicht wird dies durch die Eigenschaften von PoL-Leistungswandlern: hohe Stromdichte, geringere Anzahl von Bauteilen und, was sehr wichtig ist, Flexibilität bei der Platzierung. PoL-Stromversorgungskomponenten ermöglichen eine seitliche und/oder vertikale Stromzufuhr zu KI-Prozessor-Cores und Speicherbänken, was die PDN-Impedanzen erheblich verringert.

FPA in Stromversorgungen nutzen

Die FPA (Factorized Power Architecture) bildet die Grundlage für eine effiziente Stromversorgung aktueller Hochleistungsrechner. Sie unterteilt die Aufgabe eines Stromrichters in die Funktionen Regelung und Leistungswandlung. Mit PoL-Wandlern ist eine seitliche und/oder vertikale Stromzufuhr zu KI-Prozessor-Cores und Speicherbänken möglich. Bei der VPD (Vertical Power Delivery) werden Stromverviel-facher und Bypass-Kondensatoren übereinandergestapelt, um ein integriertes Leistungsmodul (GCM, Geared Current Multiplier) zu bilden.

Spitzenstromanforderungen begegnen

Moderne Grafikprozessoren (GPUs) haben dutzende Milliarden Transistoren – eine Zahl, die mit jeder neuen Generation und Produktfamilie wächst und die durch kleinere Halbleiterprozessknoten möglich wird. Die mit jeder neuen Generation einhergehenden Leistungssteigerungen der Prozessoren haben jedoch den Preis, dass die Anforderungen an die Stromversorgung erheblich steigen. Bild 1 zeigt den Anstieg des Strombedarfs aufgrund der verkleinerten Transistorgeometrie und Core-Spannungen.Spitzenstromanforderungen von bis zu 2000 A sind heute gängige Praxis. Als Reaktion auf diese Herausforderung bei der Stromversorgung evaluieren einige xPU-Unternehmen Multi-Rail-Optionen, bei denen die Hauptstromschienen des Cores in fünf oder mehr Stromeingänge mit niedrigeren Strömen aufgeteilt werden. Das PDN für jede dieser Schienen muss immer noch einen hohen Strom liefern und erfordert gleichzeitig eine individuelle strenge Regelung, was Druck auf die Dichte des PDN und seine physische Position auf der Beschleunigerkarte ausübt.Hinzu kommt, dass die hochdynamischen Workloads des maschinellen Lernens zu sehr hohen di/dt-Transienten führen, die mehrere Mikrosekunden dauern. Dies erzeugt eine Belastung im PDN eines Hochleistungsprozessormoduls oder einer Beschleunigerkarte. Der Aufbau eines typischen Stromversorgungsnetzwerks ist in Bild 2 dargestellt.

Bild 1: In den meisten Fällen ist die Stromversorgung aktuell der begrenzende Faktor für die Rechenleistung.
Bild 1: In den meisten Fällen ist die Stromversorgung aktuell der begrenzende Faktor für die Rechenleistung. (Bild: Vicor)

Auswirkung auf die Leiterplatte

Die Arbeit des OCP-Konsortiums (Open Compute Project) hat dazu beigetragen, einen Rahmen von Standards für die Entwicklung Rack- und Karten-basierter Prozessorentwicklungen zu schaffen. Der Open-Rack-Standard V2.2 definiert eine 48-V-Server-Backplane und eine 48-V-Betriebsspannung für offene OAMs (Open Accelerator Modules), die vorwiegend für KI und ML verwendet werden. Um die Kompatibilität mit älteren 12-V-Systemen aufrechtzuerhalten, sieht der Standard die Möglichkeit vor, 12-zu-48- und 48-zu-12-V-Anforderungen zu erfüllen.

Die Fokussierung auf die Stromversorgung des Prozessors (PoL) geht mit technischen Herausforderungen einher. Die Fortschritte, die oben hervorgehoben wurden, konzentrieren sich auf den Abwärtstrend bei der Spannung, die Forderung nach einer engen Toleranz bei der Core-Spannung und den Aufwärtstrend beim Stromverbrauch. Auf der Leiterplattenebene zeigen sich die Auswirkungen dieser Faktoren auf vielfältige Weise.

Die auftretenden Spitzenstromdichten sind für jede Leiterplatte extrem. Das Routing von Strompfaden, die diese hohen Lasten bewältigen können, erfordert große Aufmerksamkeit. Hochdynamische Workloads können Spannungsspitzen erzeugen, die von anspruchsvollen Prozessoren als störend und potenziell schädlich empfunden werden. Auf einer Prozessorplatine befinden sich jedoch Hunderte weitere passive Bauelement, Speicher und andere für den Betrieb wichtige ICs, die ebenfalls platziert werden müssen. Hinzu kommen noch die I2R-Verluste. Die Leiterbahnlängen der Stromversorgungspfade müssen kurz sein. Um dies zu erreichen, sollten die Leistungswandlermodule in der Nähe des Prozessors platziert werden, um die Erwärmung der Leiterbahnen zu reduzieren. Da sich die Leiterplatte aufgrund der Lastströme des Prozessors und der lokalen thermischen Gradienten des Prozessors verbiegen kann, ist eine Versteifungen der Leiterplatte nötig. Außerdem sollte der Wirkungsgrad des Wandlers so hoch wie möglich sein, um weitere Herausforderungen beim Wärmemanagement zu vermeiden.

Bild 2: Gängiges PDN für Hochleistungsprozessoren.
Bild 2: Gängiges PDN für Hochleistungsprozessoren. (Bild: Vicor)

Prozessorleistung maximieren

Um den Prozessoren heute genügen Leistung zur Verfügung zu stellen, sind Neuerungen erforderlich, um dem Status quo einen Schritt voraus zu sein. Neue Ideen, Architekturen, Topologien und Technologien sind der Weg zu einem zuverlässigeren, skalierbaren Stromversorgungsnetz. Die FPA ist dabei die Grundlage für eine effizientere Stromversorgung aktueller Hochleistungsrechner.

Sie unterteilt die Aufgabe eines Stromrichters in die jeweiligen Funktionen Regelung und Leistungswandlung. Durch die Trennung und individuelle Optimierung der beiden Funktionen wird eine effiziente Lösung mit hoher Dichte erreicht. FPA bildet zusammen mit der SAC-Topologie (Sine Amplitude Converter) die Grundlage für mehrere neue Architekturen, die dazu beitragen, die volle Leistungsfähigkeit von Hochleistungsprozessoren zu entfalten.

Bild 3: Die FPA faktorisiert die Leistung in die speziellen Funktionen Regelung und Wandlung.
Bild 3: Die FPA faktorisiert die Leistung in die speziellen Funktionen Regelung und Wandlung. (Bild: Vicor)

Laterale und vertikale Leistungsabgabe

LPD (Lateral Power Delivery) ist eine Technik, bei der die beiden Stromvervielfacher (VTM-Module) an die North- und South- oder die East- und West-Flanke des Prozessors angrenzen. Die Technik ist für Lastströme von ~800 A bei 0,8 V Nennspannung mit einem zugehörigen PDN von 70 µΩ bei 100 °C vorzuziehen. Anhand dieser Werte lässt sich eine Verlustleistung von ~45 W ermitteln. Ein Kühlkörper, der sowohl die 2,8 mm hohen Stromvervielfacher als auch den Prozessor abdeckt (Bild 4), unterstützt das Wärmemanagement. Dieser Aufbau eignet sich für die Stromversorgung von Grafikbeschleunigerkarten (OAM oder andere), Netzwerk-ASICs und APUs, die in Hyperscale-Rechenzentren oder Supercomputer-Schränken eingesetzt werden.

Lateral-Vertical Power Delivery ähnelt der LPD, jedoch mit dem Unterschied, dass nur 70 Prozent der Leistung seitlich über die Stromvervielfacher an den Prozessor geliefert wird. Ein zusätzlicher Stromvervielfacher an der Unterseite des Prozessors stellt die restlichen 30 Prozent des Laststroms direkt an das Prozessor-BGA bereit. Durch die Kombination aus seitlichen und vertikalen Stromverteilern werden die PDN-Verluste fast um den Faktor vier reduziert. Damit wird auch Platz auf der Platine frei, um eine zweite Hochstromschiene (Aux) oder Versorgungsschienen für breitbandigen Speicher (HBM; High-Bandwidth Memory) auf der Oberseite der Platine um den Prozessor herum unterzubringen.

Bild 4: Laterale Leistungsabgabe (LPD) und vertikale Leistungsabgabe (VPD) ermöglichen Prozessoren, bisher unerreichte Leistungsniveaus zu erreichen, um die wachsenden Anforderungen an die HPC-Verarbeitung zu unterstützen.
Bild 4: Laterale Leistungsabgabe (LPD) und vertikale Leistungsabgabe (VPD) ermöglichen Prozessoren, bisher unerreichte Leistungsniveaus zu erreichen, um die wachsenden Anforderungen an die HPC-Verarbeitung zu unterstützen. (Bild: Vicor)

Vertical-Lateral Power Delivery hingegen nutzt den Vorteil, dass mehr als 50 Prozent des Laststroms durch zusätzliche Stromvervielfacher auf der Unterseite des Prozessors geleitet werden. Die Technik ermöglicht eine weitere Reduzierung der PDN-Verluste um 50 Prozent im Vergleich zum lateral-vertikalen Ansatz. Ein 1200-A-Design kann einen PDN-Widerstand von nur 10 µΩ realisieren, was zu weniger als 14,4 W Verlustleistung führt. In diesem Fall lassen sich Kühlkörper sowohl an der Ober- als auch an der Unterseite der Last platzieren, wenn es der Platz zulässt. Diese Ar-chitektur eignet sich vor allem für Anwendungen, die sich keine Leistungsbauteile auf der Oberseite der Leiterplatte leisten können, um eine schnelle Signalführung von der Peripherie des ASICs zu ermöglichen. Beispiele hierfür sind CPO/NPO (Co-/Near-Packaged Optics) und Netzwerk-/Breitbandkommunikations-ICs.

Vertical Power Delivery (VPD) ist die Lösung der Wahl, wenn es darum geht, sehr hohe Ströme bei niedrigen Prozessor-Core-Spannungen mit dem geringsten PDN-Widerstand zu liefern. Dabei werden Stromvervielfacher und Bypass-Kondensatoren übereinandergestapelt, um ein integriertes Leistungsmodul (GCM; Geared Current Multiplier) zu bilden. Dieses lässt sich direkt unter dem Prozessor montieren, indem die Bypass-Kondensatorbank versetzt wird. Bei den GCMs von Vicor handelt es sich um anwender-spezifische Bauteile, die die Pinbelegung des Stromvervielfachers auf das BGA des KI-Prozessors abbilden und in der Lage sind, den gesamten Bedarf an Bypass-Kondensatoren innerhalb des Moduls selbst abzudecken. Diese Technik macht die oberste Ebene der Leiterplatte frei für die Hochgeschwindigkeits-Signalführung von der Peripherie des Prozessors, um eine Lösung mit höchster Signalintegrität bereitzustellen. Anwendungen wie CPO, Netzwerkprozessoren und schnelle Signalisierungs-ASICs profitieren von dieser Stromversorgungstechnik.

Die Architekturen lassen sich an verschiedene Hochleistungs-Computing- sowie HPC-Lösungen anpassen und reduzieren die Widerstände auf dem Motherboard um das bis zu 50-fache und die Zahl der benötigten Stromversorgungspins um mehr als das 10-fache. Damit erreichen die Prozessoren bisher unerreichte Leistungsniveaus, um die aktuellen stetig wachsenden HPC-Anforderungen zu unterstützen.

FPA in anspruchsvolle Anwendungen

FPA-Architekturen sind in Bezug auf Stromdichte und geringere Leistungsverluste einem PDN überlegen. Robuste, zuverlässige Leistungsmodule in Verbindung mit aktuellen Topologien sind in dynamischen Systemen, in denen sich die Leistungsanforderungen schnell ändern, unerlässlich. Künstliche Intelligenz, Maschinelles Lernen und Edge-Computing werden mit herkömmlichen Stromversorgungsarchitekturen nie genug Leistung für die Zukunft haben. Um diesen ständigen Bedarf zu decken, müssen wir heute innovativ sein und mit modularer Stromversorgung auf die Anpassung und Skalierung für morgen vorbereitet sein. (bs)

Ajith JainVice President HPC Business Unit bei Vicor

Sie möchten gerne weiterlesen?