Bild 3: Kupfer ist der Freund der Entwärmung, hat aber auch kritische Eigenschaften: Kupfer verändert seine elektrischen Eigenschaften bei Hitze.  Congatec

(Bild: Congatec)

Eckdaten

Durch eine ganzheitliche Betrachtung von Messung, elektrischer Simulation, thermischer und elektrothermischer Untersuchung wurde letztlich eine deutliche Optimierung des gesamten Designs des neuen COM-Express-Board Conga-B7XD erreicht.

Um zu verstehen, welche Herausforderungen bei aktuellen High-Speed-Designs zu meistern sind, kann dabei ein prototypisches Design dienen, das für das neue COM Express Type 7 Server-on-Module mit Intel-Xeon-D-1577-Prozessor entwickelt wurde, der 16 Cores hat und 2 × 10 Gigabit Ethernet KR Interface sowie 32 × PCI Express Gen 3 Lanes unterstützt.

Tatort Embedded-Edge-Sever-Design

Diese neue Generation leistungsstarker Embedded-Edge-Server-Produkte markiert derzeit das oberste Ende der verfügbaren Leistungsfähigkeit von Embedded-Edge-Server-Designs. Jedoch brachte diese Leistungs- und Performanceklasse physikalische Kausalketten zum Vorschein, die bei Low-Power-Produkten, wie sie im klassischen Embedded-Computing-Markt bislang üblich sind, nicht gravierend in Erscheinung treten. Die Ingenieure stießen bei ihren umfangreichen Tests für ein Server-on-Modules-Design – das bis zu 100 Watt verbrauchen kann, zum Beispiel in der Auslegung mit beispielsweise AMD-Epyc-Prozessor – zunächst auf Signalstörungen. Obwohl bewährte Maßnahmen der HF-Technik, Layoutgestaltung für optimale Signalqualität und Dimensionierungen im Design berücksichtigt worden waren, zeigte der erste Prototyp jedoch Auffälligkeiten im Compliance-Test. Die Spezialisten der Testabteilung, die alle Transmitter und Receiver im hausinternen Labor mittels „Compliance-Tests“ auf das Einhalten der Spezifikation testen, sahen deshalb Handlungsbedarf.

Statistisch verteilte und sporadische Fehler

Folie 1

Sieben Simulationsschritte: Durch die Veränderung der Kupferdicken sowie Via-Anzahl und Via-Placements konnte die minimale und maximale Temperatur des COM-Express-Type-7-Designs im Schnitt um rund 12 % gesenkt werden. Congatec

Der Betrieb außerhalb der Compliance kann zu zufälligen, nicht vorhersehbaren Ausfällen führen. Das System funktioniert dann zwar meistens, aber im Zusammenspiel mit externen Komponenten können Aussetzer auftreten. Solche sporadisch auftretenden Fehler lassen sich nur sehr schwer analysieren. Aber solche Fehler sind äußerst kritisch und ihre Folgen werden erfahrungsgemäß teuer. Neben den EMV-Compliance-Tests, die sicherstellen, dass Abstrahlungen definierte Strahlungswerte nicht überschreiten, müssen auch die Transmitter und Receiver der Highspeed-Kommunikationsschnittstellen eine definierte Signalqualität einhalten. Und bei all diesen Tests gibt es Grenzwerte, die einzuhalten sind. Befinden sich die Werte innerhalb des erlaubten Bereichs, garantiert dies die erfolgreiche Zusammenarbeit zweier Geräte.

Performance gefährdet

Bei der Sata-Schnittstelle beispielsweise garantiert die Einhaltung der Sata-Spezifikation die erfolgreiche Kommunikation zwischen dem Mainboard und jeder beliebigen Festplatte. Vorausgesetzt, beide Seiten sind „compliant“ und halten die Spezifikation ein. Befinden sich die Werte außerhalb, jedoch in Grenznähe, kann die Kommunikation des Boards mit einigen Festplatten dennoch funktionieren. Bei der Analyse der Smart-Werte der Festplatte, zeigen diese häufig Übertragungsfehler, die eigentlich nicht auftreten sollten. Ein erkannter Fehler in der Kommunikation löst zudem die erneute Übertragung des Datenpaketes aus. In der Folge sinkt die tatsächlich erreichte Datenrate. Erst wenn die Compliance weiter außerhalb der Spezifikation liegt, wird die Festplatte irgendwann nicht mehr erkannt und Datenverlust ist die Folge.

Compliance ermitteln

Im Beispiel der Sata-Schnittstelle ist eine erfolgreich getestete Kommunikation noch lange kein Nachweis der Sata-Compliance. Der rein funktionale Test im Labor mit einigen zufällig ausgewählten Festplatten ersetzt also keine Compliance-Untersuchung. Der Nachweis der Compliance kann hingegen durch eine ausführliche Charakterisierung des Designs mittels Messungen geführt werden. Hierfür betreibt Congatec ein eigenes Testlabor im Haus, ausgestattet mit Präzisionsmessgeräten in Millionenhöhe. Der Vorteil des hausinternen Labors liegt auf der Hand. Je tiefer man in der sicheren Zone arbeitet, umso höher ist die Zuverlässigkeit und Funktion über lange Zeit. Eine genaue Kenntnis der Sicherheitsmarge trägt zur Qualitätssicherung bei. Congatec optimiert seine Produkte mittels Simulationen und verifiziert die Optimierung mittels umfangreicher Empfänger- (RX) und Sender- (TX) Compliance-Messungen. Um die Zukunftssicherheit zu gewährleisten, wurde in 2018 auch ein neuer Messplatz angeschafft, der die Charakterisierung von „Next-Generation“-Interfaces – wie zum Beispiel USB 3.2 Gen2 – der Transmitter und der Receiver erlaubt. Auch im Bereich „Signal Integrity“ kann das Unternehmen auf ausgewiesene Spezialisten zurückgreifen, um umfassende Services anbieten zu können. Das Ziel ist letztlich den Nachweis zu erbringen, dass Kunden das Ziel der Compliance sicher erreichen und sich, wenn gewünscht, auch durch ein Zertifikat extern bestätigen lassen können.

Thema der nächsten Seite: Compliance mit Brief und Siegel

Bild 2: Das Testlabor, in dem auch OEM-Carrierboard-Designs getestet werden, ist mit Präzisionsmessgeräten in Millionenhöhe ausgestattet. Congatec

Das Testlabor, in dem auch OEM-Carrierboard-Designs getestet werden, ist mit Präzisionsmessgeräten in Millionenhöhe ausgestattet. Congatec

Ein solches Zertifikat des jeweiligen Standardisierungsgremiums kann jedoch erst nach dem Compliance-Test der kompletten Einheit – bestehend aus COM-Express-Modul und passendem Carrierboard – ausgestellt werden. Dieses Carrierboard ist im realen Einsatz eine kunden- und applikationsspezifische Platine. Damit der Kunde später seinen eigenen Compliance-Test erfolgreich bestehen kann, schöpft Congatec auf der eigenen Seite alle technischen Möglichkeiten aus. Im hauseigenen, speziell dafür ausgestatteten Testlabor stellt das COM-Express-Modul in Funktionseinheit mit einem Referenz-Carrier in einem „Pre-Compliance“-Test seine Compliance-Fähigkeit unter Beweis. Dieser „Pre-Compliance“-Test für Transmit und Receive gehört dabei zu dem erforderlichen Engagement, um den besonders hohen Qualitätsansprüchen eines Marktführers gerecht werden zu können. Zudem unterstützt das Unternehmen seine Kunden bei ihren eigenen Compliance-Bestrebungen für das Applikations-Carrierboard mit Expertenwissen, jahrelang gesammelter Erfahrung und Laborleistungen. Diese schützt Kundenapplikationen dabei auch vor den Fehlern, die durch den Betrieb im Grenzbereich verursacht werden könnten. In der Kommunikation werden beispielsweise geringere Fehlerraten, weniger Störungen und damit eine höhere reale Bandbreite und eine insgesamt bessere Performance durch regelkonformes Verhalten erreicht. Compliance ist also zwingend erforderlich. Zurück zum realen Praxisbeispiel.

Taskforce „Störfaktor“

Ein auffälliges Verhalten bei einem Common-Mode-Compliance-Test des COM-Express-Type-7-High-Speed-Designs führte die leitenden Testingenieure auf einer ersten heißen Spur zu zwei Leistungselementen im DC/DC-Wandler. Doch die verdächtigten FETs wurden gemäß ihrer Datenblattspezifikation betrieben, hatten also auf den ersten Blick ein perfektes Alibi. Jedoch wurden ihre steilen Schaltflanken als Störenfriede entlarvt. Änderungen an den Schaltflanken haben aber Einfluss auf den Wirkungsgrad der Schaltregler. Langsamere Schaltflanken verringern zwar Störungen, vermindern aber die Effizienz und das Leistungselement wird heiß. Das wiederum beeinträchtigt seine Lebensdauer. Die Taskforce „Störfaktor“ weitete deshalb ihr Ermittlungsgebiet auf thermische Betrachtungen aus. Ziel war es, die Regler gleichzeitig in einen störungsfreien Betriebsmodus zu überführen und ihre Entwärmung zu optimieren, denn jedes Grad weniger verlängert die Lebensdauer des Leistungselementes.

Optimierungsfokus Entwärmung

Als Hersteller des COM-Express-Type-7-Server-on-Moduls hat Congatec zwar keinen Einfluss auf die Umgebungsbedingungen, denen das Board später in der Applikation ausgesetzt sein wird. Unbekannt sind beispielsweise die Art der Kühlung – zum Beispiel, wenn kein auf das Modul optimierter Congatec-Kühlkörper eingesetzt wird – oder der Verlauf des Luftstroms im realen Einsatzfall. Als Stellschraube steht nur das Modul selbst zur Verfügung und auf diesem muss sich die Wärme für einen thermisch optimalen Betrieb möglichst schnell und gleichmäßig verteilen. Eine wirksame Verteilung verhindert kritisch überhitzte Hot-Spots. Entwärmungs-Überlegungen können sich bei High-Speed-Designs nicht mehr ausschließlich auf die CPU fokussieren. Es sind vielmehr auch alle weiteren Halbleiterelemente und vor allem auch die Leiterplatte zu betrachten. Hierbei ist zu beachten, dass die meisten wärmeentwickelnden Bauteile auf einem Kupferpad sitzen. Ihre Wärme wird dabei über Vias auf die großen Kupferflächen einer GND-Plane abgeleitet. Zu berücksichtigen ist deshalb auch der Einfluss dieser Vias und ihrer Lage im Design. Eine gute thermische Anbindung bedeutet in der Regel aber auch eine gute elektrische Anbindung für eventuelle Störsignale auf Signalleitungen. Hier den richtigen Kompromiss zu finden erfordert umfangreiches Know-how und, wenn nötig, die geeigneten Simulationstools.

Thema der nächsten Seite: Ist Kupfer wirklich der rettende Freund?

In der thermischen Betrachtung ist Kupfer der Freund der Entwärmung und hier gilt dabei für die Kupferdicke das Motto: „Viel hilft viel“. Dies gilt allerdings nicht für hochfrequente Signalleitungen. Hier gilt dieser Grundsatz nicht. Deshalb ist es für das Gesamtoptimum notwendig, die Entwärmung in der richtigen Menge, am richtigen Ort, zur richtigen Zeit einzusetzen. In der Fertigung ist Kupfer zudem teuer und die Fertigung von Vias mit viel Kupfer ist kompliziert. Kupfer hat aber auch seine kritischen Eigenschaften: Kupfer verändert seine elektrischen Eigenschaften bei Hitze. Leistungselemente in der Spannungsversorgung ziehen Strom. Fließt ein hoher Strom über eine Leitung, wird sie heiß. Ihr Widerstand steigt mit jedem Grad Celsius. Höherer Widerstand bedeutet mehr Verlustleistung. Diese Verluste führen zu einer weiteren Erwärmung, der Widerstand steigt erneut. Im schlimmsten Fall führt dies zu einer Kettenreaktion, einer „Spirale des Bösen“, bei der die Leiterbahnen oder Vias aufschmelzen und wegbrennen können.

Thermische versus elektrothermische Simulation

Um diese Faktoren zu berücksichtigen, gibt es zwei Arten der thermischen Simulation: Die rein thermische Betrachtung stellt ausschließlich das Element Verlustleistung der Bauteile in den Fokus. Als Ergebnis kann man erkennen, wieviel Energie dieses Element in Wärme umsetzt und wie effektiv Kühlmaßnahmen arbeiten. Die elektrothermische Simulation berücksichtigt darüber hinaus auch den Strom auf der Leiterbahn, speziell in den Stromversorgungen. Deshalb wurde das Design des COM-Express-Boards Conga-B7XD auch neben den Compliance- und Analysemessungen detaillierten elektrischen und elektrothermischen Simulationen unterzogen. Untersucht wurden hierbei verschiedene Aspekte:

  • Wie lässt sich die thermische Anbindung der Bauteile verbessern und zugleich die elektrische Anbindung entkoppeln?
  • Wie lässt sich durch Optimierung von parasitären Induktivitäten am DC/DC-Wandler der Einfluss schneller Schaltflanken reduzieren?
  • Wie ist es möglich, die Schaltgeschwindigkeiten zu reduzieren, ohne die Effizienz der Schaltung zu reduzieren?
  • Welche Möglichkeiten gibt es, um die Entwärmung der Bauteile zu optimieren, um selbst bei einer Reduktion der Schaltgeschwindigkeiten weitere Reserven für die Temperaturbelastung der Bauteile zu erhalten?

Durch eine ganzheitliche Betrachtung von Messung, elektrischer Simulation, thermischer und elektrothermischer Untersuchung wurde letztlich eine deutliche Optimierung des gesamten Designs des neuen COM-Express-Board conga-B7XD erreicht.

Fall gelöst

Die Taskforce Störfaktor löste ihren Fall erfolgreich und legte ihn am Ende mit bestandener Compliance-Untersuchung und optimierter Entwärmung zu den Akten. Ergebnisse ihrer Arbeit sind zum einen ein Hochleistungsboard, das sich an die Regeln der Compliance hält. Darüber hinaus verringert das thermisch optimierte Design den Kühllösungsaufwand des Kunden und spart damit Kosten ein, weil die Entwärmung in der Applikation einfacher sein wird.

Zusammenfassung

Compliance stellt die erfolgreiche Zusammenarbeit mit anderen Geräten sicher und garantiert beste Performance, Bandbreite und Störsicherheit. Sie ist zwingend erforderlich. Der Nachweis der Compliance kann nicht über funktionale Tests erreicht werden. Erst umfangreiche Simulationen und Messungen im entsprechend ausgerüsteten Testlabor, wie sie Congatec auch für OEM-Carrierboards bereitstellt, liefern den tragfähigen Nachweis der Compliance. Als Nebeneffekt der Compliance-Untersuchungen finden sich dabei oft auch wertvolle Hinweise für weitere Optimierungen der thermischen und elektrischen Dimensionierung des OEM-Designs. Im Ergebnis erreichen Kunden letztlich eine hohe Sicherheitsmarge in der Compliance ihrer Lösungen, was auch Aufwand und Kosten bei der Dimensionierung von Kühllösungen reduzieren kann.

 

Zeljko Loncaric

Marketing Engineer, Congatec

(neu)

Sie möchten gerne weiterlesen?