SSDs in rauen Umgebungen

Sicherheit vor Datenverlust bei Stromausfällen und Spannungsschwankungen

Unerwartete Stromausfälle und Spannungsschwankungen gefährden Daten auf SSDs. Apacer begegnet diesen Risiken mit CorePower, CoreVolt 2 und SSDWidget 2.0 – für zuverlässigen Betrieb in rauen Umgebungen.
Unerwartete Stromausfälle und Spannungsschwankungen gefährden Daten auf SSDs. Apacer begegnet diesen Risiken mit CorePower, CoreVolt 2 und SSDWidget 2.0 – für zuverlässigen Betrieb in rauen Umgebungen.

In rauen Umgebungen gefährden Stromausfälle und Spannungsschwankungen die Datenintegrität von SSDs. Apacer begegnet diesen Risiken mit CorePower, CoreVolt 2 und einem globalen Monitoring-System für maximale Ausfallsicherheit.

SSDs haben sich als schnelle und stabile Alternative zu HDDs durchgesetzt. Robust sind sie jedoch nur bei mechanischen Einflüssen wie Erschütterungen oder Schwingungen. Gegenüber unerwarteten Stromausfällen oder Spannungsschwankungen sind sie empfindlich.

Die Untersuchung „Understanding the Robustness of SSDs under Power Fault“ der Universität von Ohio und HP Labs kommt zu dem Schluss: „Because we do not know how to build durable systems that can withstand all of these kinds of failures, we recommend system builders either not use SSDs for important information that needs to be durable or that they test their actual SSD models carefully under actual power failures beforehand. Failure to do so risks massive data loss.“

Folgen unerwarteter Stromausfälle

Für derartige Schäden und Datenverluste gibt es mehrere Gründe: Erhält eine SSD plötzlich zu wenig oder gar keinen Strom mehr, können Daten während der Übertragung vom Host-System zur SSD verlorengehen. Das betrifft vor allem SSDs, die mit SRAM oder DRAM für eine zufällige Leistungsverbesserung ausgelegt sind. Bei ihnen speichert der Controller die vom Host geschriebenen Daten zuerst in dem (flüchtigen) DRAM-Cache. Nach Beendigung des Schreibvorgangs geht ein Signal an den Host. Wird in diesem Moment die Stromzufuhr unterbrochen, sind die Daten verloren, bevor sie vom DRAM auf den NAND-Flash verschoben werden konnten. (Bild 1)

Ein Stromausfall kann außerdem die Verknüpfungstabelle schädigen. Ihre Mapping-Informationen, etwa der DRAM-Schreibcache, werden zunächst in der Controller-Stufe zwischengespeichert. Erst im zweiten Schritt werden sie in den Flash-Speicher geschoben, wo sie als "gehärtete" Informationen abliegen. Nach einem Stromausfall können Zuordnungsinformationen fehlen, sodass das Gerät beim nächsten Einschalten beschädigte Daten anzeigt und der Host keine gültigen Daten vom Gerät abrufen kann.

Bild 1: SSDs, die mit SRAM oder DRAM ausgestattet sind, sind besonders anfällig für Datenverluste bei einer Unterbrechung der Stromzufuhr.
Bild 1: SSDs, die mit SRAM oder DRAM ausgestattet sind, sind besonders anfällig für Datenverluste bei einer Unterbrechung der Stromzufuhr.

Eine andere potenzielle Folge eines Stromausfalls sind korrumpierte Seiten des NAND-Flashs. Die NAND-Flash-Programmierung ist üblicherweise in mehrere Schreibvorgänge unterteilt, bei jedem Vorgang wird eine Seite eines Blocks beschrieben. Kommt es während der Programmierung zu einem plötzlichen Stromausfall, wird die Seite mit den Daten, die in diesem Moment programmiert werden, als ungültig und fehlerhaft eingestuft. In Bild 2 führt der Host Schreibvorgänge auf einen NAND-Block durch. Während die Seite s4 programmiert wird, bricht die Stromzufuhr ab. Ist die Stromversorgung wiederhergestellt, sind die Daten auf Seite s4 ungültig. Daten, die durch die vorherigen Programmiervorgänge auf den Seiten s1, s2 und s3 geschrieben wurden, sind nicht betroffen, da sie bereits in die Flash-Chips geschrieben worden waren. Die ECC in der Firmware erkennt und korrigiert den Fehler in Seite s4, um die Datenintegrität des gesamten Blocks zu gewährleisten.

Bild 2: Ein NAND-Flash-Speicher wird in der Regel seitenweise beschrieben. Wird die Stromzufuhr unterbrochen, kann die in diesem Moment beschriebene Seite unlesbar werden (hier Page s4).
Bild 2: Ein NAND-Flash-Speicher wird in der Regel seitenweise beschrieben. Wird die Stromzufuhr unterbrochen, kann die in diesem Moment beschriebene Seite unlesbar werden (hier Page s4).

Kondensatoren überbrücken Stromausfall

Um die Datenintegrität auch bei einem unerwarteten Stromausfall sicherzustellen, hat Apacer die hardwarebasierte Technologie „CorePower“ entwickelt. Die entsprechenden SSDs sind mit leistungsstarken Tantal-Polymer-Kondensatoren ausgestattet. Bricht die Stromversorgung ab, liefern die Kondensatoren genug Strom, damit der Flash-Controller zwischengespeicherte Daten in die NAND-Flash-Blöcke schreiben kann (Bild 3).

So verhindern sie, dass wertvolle Daten verlorengehen oder beschädigt werden. Zudem sind die SSDs mit CorePower-Technologie (Bild 4) widerstandsfähiger gegen extreme Umgebungstemperaturen, bieten mehr Schreib-/Löschzyklen und eine längere Lebensdauer.

Folgen von Spannungsschwankungen

Neben Stromunterbrechungen sind auch Spannungsinstabilitäten durch inkonsistente Stromversorgungen, Stromstöße oder Umweltfaktoren ein Risiko. Sie können zu beschädigten Daten und Komponenten führen und damit zu kostspieligen Ausfallzeiten. Für Unternehmen kann das finanzielle Verluste, verpasste Chancen und Imageverlust bedeuten – insbesondere in Branchen, in denen es auf Zuverlässigkeit und Betriebszeit ankommt.

Hier ist der Schutz von SSDs vor Spannungsinstabilität unerlässlich, um eine konsistente Leistung zu gewährleisten und wertvolle Daten zu schützen. Das gilt ganz besonders in unternehmenskritischen Umgebungen, die auf SSDs angewiesen sind. Eine Lösung bietet die CoreVolt-2-Technologie von Apacer.

Bild 3: Durch eine Backup-Stromversorgung sorgt die CorePower-Technologie dafür, dass alle Daten auch bei einem Stromausfall sicher auf dem NAND-Flash abgelegt werden können.
Bild 3: Durch eine Backup-Stromversorgung sorgt die CorePower-Technologie dafür, dass alle Daten auch bei einem Stromausfall sicher auf dem NAND-Flash abgelegt werden können.

Echtzeiterkennung und aktiver Schutz

Im Gegensatz zur Technologie DataDefender Plus von Apacer, die Fälle von instabiler Spannung protokolliert und Warnmeldungen sendet, schützt CoreVolt 2 aktiv vor Schäden.

Die Technologie arbeitet mit einem integrierten Echtzeit-Spannungserkennungssystem, das die Eingangsspannung der SSD kontinuierlich überwacht und jede Form von Spannungsinstabilität erkennt. Sobald das System eine Abweichung detektiert, die über den zulässigen Schwellenwert hinausgeht, aktiviert es sofort ein Notstromsystem. Dies erfolgt verzögerungsfrei, was für den Schutz von Daten und die Aufrechterhaltung der Betriebskontinuität entscheidend ist.

Die Notstromversorgung wird durch Tantal-Polymer-Kondensatoren bereitgestellt. Sie übernehmen vorübergehend die Stromversorgung und stabilisieren so den Betrieb der SSD während der Schwankung (Bild 5). Dieser Prozess läuft ohne manuelles Eingreifen automatisch im Hintergrund ab und schützt vor beschädigte Daten, Hardwareschäden oder Systemausfällen.

Bild 4: Apacer bietet SSDs mit CorePower-Technologie in zahlreichen Formfaktoren.
Bild 4: Apacer bietet SSDs mit CorePower-Technologie in zahlreichen Formfaktoren.

Das macht CoreVolt 2 zu einer sinnvollen Lösung vor allem für Branchen, die eine hohe Zuverlässigkeit und einen unterbrechungsfreien Betrieb benötigen und gleichzeitig häufig mit rauen Bedingungen, Stromschwankungen und potenziellen Überspannungen zu tun haben, etwa Industriecomputer und Robotik, Luft- und Raumfahrt, Transport und Bergbau.

Umfassendes Monitoring rund um den Globus

Datenverluste können jedoch nicht nur aufgrund von Stromausfällen und Spannungsschwankungen verursacht werden, sondern auch durch Defekte elektronischer Komponenten oder einen mangelhaften Gesundheitszustand der SSD aufgrund von Abnutzung oder dem nahenden Ende der möglichen Schreib-/Lösch-Zyklen.

Dies ist besonders für solche Netzwerke eine Gefahr, in denen zahlreiche intelligente Geräte miteinander verbunden sind, sei es IoT, IIoT oder AIoT. Denn sie sind nur so gut wie die SSDs, auf denen die Daten gespeichert werden.

Bild 5: Kondensatoren gleichen Spannungsschwankungen aus und sorgen so dafür, dass die SSD ohne Unterbrechung weiterläuft.
Bild 5: Kondensatoren gleichen Spannungsschwankungen aus und sorgen so dafür, dass die SSD ohne Unterbrechung weiterläuft.

Um diese Risiken zu minimieren und Echtzeit-Interaktionen zu ermöglichen, hat Apacer ein effektives SSD-Management für das Host-System entwickelt: SSDWidget 2.0 überwacht die gesundheitsbezogenen Informationen von SSDs, ihre Lebensdauer und Arbeitslast und bietet Administratoren eine Übersicht zu allen SSDs in einem Netzwerk aus allen Regionen weltweit in einem übersichtlichen Dashboard (Bild 6). Unternehmen können diese Daten in ihrer Private Cloud speichern.

Bild 6: Das Dashboard des SSDWidget 2.0 enthält die wichtigsten Informationen und Funktionen auf einen Blick.
Bild 6: Das Dashboard des SSDWidget 2.0 enthält die wichtigsten Informationen und Funktionen auf einen Blick.

Die S.M.A.R.T.-Funktion des SSDWidget 2.0 liefert Informationen zur SSD-Lebensdauer und zur Analyse der Arbeitslast. Das umfasst die Anzahl der ursprünglich sowie später fehlerhaften Blöcke, die maximale und durchschnittliche Zahl an Löschvorgängen sowie die Betriebsstunden und Einschaltzyklen. Diese Informationen sind eine hilfreiche Referenz für die Geräteauslastung, die Lebensdauer und die Ausfallvorhersage. Das Schreib- und Leseverhalten der SSDs lässt sich auch im Detail analysieren, sodass jede SSD optimal genutzt und konfiguriert werden kann. Eine weitere Funktion ermöglicht die Optimierung der Effizienz, Endurance und Geschwindigkeit der SSD und bietet eine Echtzeit-Anzeige der Speicheraktivitäten. Mit „secure erase“ lassen sich Daten auf beliebigen SSDs im Netzwerk komplett löschen, um die Vertraulichkeit bzw. den Datenschutz zu gewährleisten. So vereinfacht SSDWidget 2.0 die Verwaltung und Wartung zahlreicher SSDs an verteilten Orten.

Ein weiterer Vorteil von SSDWidget 2.0 besteht in den zahlreichen wertsteigernden Funktionen: Sobald die SSD-Firmware mit aktiviertem CoreVolt 2 erkannt wird, ändert sich das Symbol auf der Hauptseite in eine Anzeige für abnormale Spannungswerte, mit der Nutzer den Spannungslevel in Echtzeit überwachen können. In einem speziellen Attribut werden abnormale Spannungswerte außerdem in S.M.A.R.T. ID 203 aufgezeichnet – ein Vorteil sowohl für den Benutzer als auch für Apacer, weil dies die Fehlersuche erleichtert, falls im System Spannungsfehler auftreten sollten. (na)

Autor:

David Chung, Project Manager, Apacer Technology