nach oben

News

Power Management in virtualisierten Rechenzentren
25. März 2019 -

Durchdachtes Power Management ist Plicht für Rechenzentren mit virtueller Infrastruktur

Zunehmenden Leistungsanforderungen begegnen Betreiber von Rechenzentren
verstärkt mit der Virtualisierung ihrer Infrastruktur. Neben den Effizienzgewinnen bedeutet dieses Vorgehen aber auch neue Komplexität. Besonders bei Unterbrechungen in der Stromversorgung droht ohne ausreichende Sicherheitsvorkehrungen Datenverlust. Simon Feger, Product Support Manager bei Eaton zeigt, wie sich Rechenzentrumsbetreiber auf den Ernstfall vorbereiten können.

Getrieben durch die regelrechte Datenexplosion im Zuge der Digitalisierung fällt es Administratoren in Rechenzentren sogar schon im Regelbetrieb schwer, den Überblick über ihre Stromversorgung zu behalten. Sie müssen sich um eine Vielzahl an Stromverteilungs- und Notfallsystemen sowie Shutdown-Applikationen kümmern. Wenn dann noch Probleme mit der Infrastruktur auftreten, kann es schnell chaotisch werden.

Wie immer in der digitalen Welt steigt auch in Rechenzentren mit zunehmender Leistung die Komplexität. Durch die Virtualisierung lassen sich Hardware-Ressourcen besser nutzen, was zu einer gesteigerten Leistung in der Datenverarbeitung führt, gleichzeitig aber Strom- und Hardware-Kosten
senken kann. Das wird möglich durch die flexible Verknüpfung und Zusammenfassung unterschiedlichster IT-Ressourcen, abgekoppelt von physischer Verkabelung.

Den Überblick behalten

Mit verschiedenen virtuellen Maschinen, die auch auf verschiedenen physischen Servern gehostet werden, ergeben sich vielschichtige gegenseitige Abhängigkeiten, die nicht immer nachvollziehbar für Administratoren sind. Das wirkt sich auch auf die Stromversorgung aus. Mit einer Power- Management-Software, die sich direkt in Virtualisierungslösungen einbinden kann und verschiedene Messdaten erhebt, behalten IT-Verantwortliche stets den Überblick über ihre Versorgungsinfrastruktur. Über eine einheitliche Benutzeroberfläche überwachen und verwalten sie mehrere Geräte im Netzwerk aus der Ferne.

Darüber hinaus können Administratoren mit einer leistungsfähigen Power-Management-Lösung unkomplizierte Massen-Upgrades durchführen, um Netzwerkmanagement-Karten und Anwendungen der unterbrechungsfreien Stromversorgung (USV) auf den neuesten Stand zu bringen. Diese
Automatisierungsfunktion spart Arbeitszeit und Nerven und reduziert gleichzeitig die Gefahr von Fehlkonfigurationen. Damit eine solche Software auch in Umgebungen mit hohem Sicherheitsanspruch zum Einsatz kommen kann, muss sie überdies mit mehreren passwortgeschützten Zugangsebenen und SSL-Verschlüsselung ausgestattet sein.

Für den Ernstfall vorbereitet sein

Moderne Rechenzentren verfügen üblicherweise über unterbrechungsfreie Stromversorgungs-Anlagen (USV). Diese sind in der Lage, Netzprobleme und kurze Stromausfälle zu kompensieren, um beispielweise die Anlaufzeit von Notstromgeneratoren zu überbrücken. Längerfristige Störungen
überschreiten jedoch die USV-Stützzeit. Moderne Power-Management-Lösungen, die automatisiert und autonom operieren, können hier eingreifen. Sie koppeln Hypervisor-Ebene und Stromversorgung miteinander und haben Zugriff auf betriebsrelevante Daten der Stromversorgung, darunter USV-Überbrückungszeit, Status der Rack-PDU-Gruppen und die Verfügbarkeit des externen Stromnetzes oder auch Klimaanlagen. Dabei geht es auch um grundlegende Fragen, etwa danach, welches Rack eigentlich von welcher USV-Einheit versorgt wird. Auf Basis dieser Informationen können die
Lösungen je nach Schwere eines Ausfalls Szenarien einleiten, um Daten zu schützen und Prozesse umzuleiten. Ein solches Vorgehen muss schon aus Zeitgründen automatisiert ablaufen und ein Eingreifen in den laufenden Betrieb erlauben, damit die Geschäftskontinuität gewahrt bleibt.

USV- Anlagen bestehen aus den drei grundlegenden Bauteilen: Gleichrichter, Batterie und Wechselrichter und bieten höchsten Schutz und Sicherheit, wenn Sie nach dem VFI-Standard (Voltage & Frequency Independant) gemäß USV Norm DIN EN 62040-3 arbeiten. Die hierbei notwendige dauerhafte doppelte Stromwandlung verbraucht jedoch auch Energie. Daher bieteneinige moderne Systeme optional verwendbare Hocheffizienzmodi, welche die doppelte Wandlung nur bei Bedarf innerhalb von 2ms digital aktivieren können und somit höchsten Schutz mit höchster Effizienz verbinden. Solche USV-Anlagen leisten einen wichtigen Beitrag zu einem effizienteren Rechenzentrum.  

Ein Beispielszenario

Das folgende Beispiel zeigt einen möglichen Ablauf zwischen der Unterbrechung der Stromversorgung und ihrer Wiederherstellung innerhalb eines halben Arbeitstages. Die Ereignisse sind bewusst überspitzt dargestellt und spiegeln sicher nicht das normale Tagesgeschäft wieder. Es soll damit jedoch verdeutlicht werden, wie ein modernes Powermanagement mit vergleichsweise wenig Kostenaufwand auch in den ungewöhnlichsten Situationen einen klaren „Kopf“ behält und strukturiert für die größtmögliche Sicherheit und Datenverfügbarkeit sorgt:

09:00 Uhr: Die Stromversorgung aus dem Netz fällt aus. Die USV übernimmt direkt und hält mit ihren Batterien den Betrieb am Laufen.

09:01 Uhr: Die Dieselmotoren der Notstromaggregate sind angelaufen und liefern ausreichend Strom für das Rechenzentrum, das bedeutet, die USV läuft nun wieder im Regelbetrieb.

09:15 Uhr: Aufgrund einer Fehlfunktion fällt der Notstromgenerator aus. Die USV übernimmt wieder nahtlos den Betrieb. Sie verfügt nun aber nur noch über einen Teil der gesamten Kapazität, da ihre Batterien zuvor schon teilentladen wurden.

09:20 Uhr: Da absehbar ist, dass die Überbrückungszeit bei der gegenwärtigen Last nicht ausreichen würde, greift die Power Management Software ein und beginnt mit der Lastreduktion. Dazu werden einzelne, zuvor als unkritisch eingestufte Anwendungen nach einem vordefinierten Plan heruntergefahren, um Strom zu sparen.

09:25 Uhr: Die Klimatisierung fällt aus und Hardware droht wegen zu hohen Temperaturen Schaden zu nehmen. Um das zu vermeiden, muss die Leistung weiter reduziert werden. Dafür verschiebt das automatische Power Management Anwendungen in ein Backup-Rechenzentrum.

09:55 Uhr: Der lokal begrenzte Stromausfall weitet sich aus und betrifft nun auch das Ausweichrechenzentrum. Zu allem Überfluss startet auch dort der Generator nicht und die USV muss im Batteriebetrieb übernehmen.

10:00 Uhr: Es ist nicht absehbar, wann die Störung behoben sein wird. Auch im Backup-Rechenzentrum beginnt der Power Manager mit dem Shutdown einzelner Anwendungen, um eine möglichst lange Überbrückungszeit zu gewährleisten.

10:10 Uhr: Da immer noch kein Strom aus dem Netz kommt, erfolgt nun als letzte Maßnahme ein vollautomatischer, kontrollierter „Infrastructure Shutdown“. Das betrifft alle Anwendungen, Hosts und Storage selbst in voll-virtualisierten Hochverfügbarkeits-Umgebungen.

10:20 Uhr: Das Rechenzentrum ist nun vollständig abgeschaltet, inklusive der USV.

11:05 Uhr: Der Netzstrom kehrt zurück, die USV startet und lädt ihre Batterien auf eine definierte Mindestkapazität bevor Sie die Ausgangsspannung aktiviert.

13:05 Uhr: Die zum Regelbetrieb erforderliche Spannung ist nun überall im Rechenzentrum wieder vorhanden und schaltbare Steckerleisten (ePDU) starten die Hardware-Komponenten über eine programmierte Einschaltsequenz in der richtigen Reihenfolge.

13:10 Uhr: Nun wird alle Hardware wieder mit ausreichend Energie versorgt und der „Infrastructure Restart“ kann erfolgen. Dabei werden alle virtuellen Maschinen automatisch in der richtigen Reihenfolge gestartet.

13:15 Uhr: Das gesamte Rechenzentrum ist nun wieder online und kann den Regelbetrieb aufnehmen.

Fazit

Einen unkontrollierten Blackout gilt es in hochkomplexen virtualisierten Umgebungen unbedingt zu vermeiden, denn damit ist fast unweigerlich Datenverlust verbunden. Das oben genannte Extrembeispiel zeigt, dass es dabei nicht immer bei monokausalen Störungen bleiben muss und verschiedene Faktoren zusammenkommen können. Darauf müssen sich die Betreiber von Rechenzentren vorbereiten. Mit einer Power Management Software, die bei Bedarf alle notwendigen Schritte selbstständig einleitet, sind sie gut für den Ernstfall gerüstet.

Simon Feger
Product Support Manager 
Eaton