Server haben zwar eine gewisse Belüftung und Selbstkühlung, aber wir würden sie kaum als Warmblüter bezeichnen. Jede Erhöhung der Umgebungstemperatur um 0,5 °C ergibt eine Erhöhung um 0,5 °C für die durchschnittliche CPU. Mit anderen Worten, es gibt eine klare Korrelation zwischen der Temperatur des Rechenzentrums und der Temperatur der Rack-Geräte.
Wann genau wird das zu einem Problem? Es variiert je nach Gerät, aber bei den meisten CPUs besteht die Gefahr einer Überhitzung, wenn ein Server länger als einige Minuten bei Temperaturen zwischen 30–35 °C betrieben wird.
Die Mehrzahl der Rechenzentren zielt auf niedrigere Umgebungstemperaturen ab, in der Regel in Übereinstimmung mit dem empfohlenen Bereich von 18–27°C laut ASHRAE (die Varianz wird durch Faktoren wie Feuchtigkeit und Taupunkt beeinflusst). Dieser Bereich liegt offensichtlich unter dem „Point of no Return“ der CPU; allerdings ist die Temperatur im Rechenzentrum in modernen High-Density-Anlagen kaum statisch von Rack zu Rack. Heiße Stellen, die durch unzureichenden Luftstrom und andere störende Bedingungen entstehen, können in Einzelfällen dazu führen, dass kritische Geräte überhitzen.
Darüber hinaus geht es bei der Temperatur im Rechenzentrum nicht nur darum, was derzeit passiert, sondern auch darum, was passieren könnte. Die Geschichte ist voller Horrorgeschichten über CRAC-Ausfälle, die zu gefährlichen Temperaturspitzen führen. Und ja, der Betrieb Ihrer Server bei höheren Temperaturen ist effizienter, er spart Geld und schützt die Umwelt. Der Betrieb näher an Randbereichen bedeutet jedoch, dass die Temperaturen im Falle eines CRAC-Fehlers viel schneller auf gefährliche Niveaus ansteigen.
Diese Umstände sollten Manager von Rechenzentren aber nicht davon abhalten, Geräte warm laufen zu lassen. Vielmehr sollen sie dazu ermutigt werden, sicherzustellen, dass sie die nötige Temperaturtransparenz haben, um schnell reagieren zu können, wenn sie Anzeichen dafür entdecken, dass die Temperatur im Rack die sicheren Grenzwerte überschreitet. Geräte im Rechenzentrum können nicht sprechen und sich somit nicht über Hitze beschweren. Allerdings werden sie bei Überhitzung heruntergefahren, was zum Ausfall Ihrer kritischen Anwendungen führt.
Lassen Sie die Echtzeit-Temperaturüberwachung für sich sprechen
ASHRAE empfiehlt die Installation von mindestens sechs Temperatursensoren pro Rack. Drei werden vorne (oben, in der Mitte und unten) und drei hinten angebracht, um die Ansaug- und Ablufttemperaturen zu überwachen. In Einrichtungen mit hoher Dichte werden oft mehr als sechs Sensoren pro Rack verwendet, um genauere Temperatur- und Luftstrommodelle zu erstellen, was insbesondere für Rechenzentren, die bei einer Umgebungstemperatur von 26,6 °C betrieben werden, sehr empfehlenswert ist.
Warum? Die einfache Antwort ist, weil Sie eine heiße Stelle nicht entdecken können, wenn Sie sie nicht sehen können. Die Temperaturüberwachung in Echtzeit, die mit dem Netzwerk Ihres Rechenzentrums verbunden ist, benachrichtigt das dafür bestimmte Personal über SNMP, SMS oder E-Mail, wenn ein sicherer Temperaturschwellenwert überschritten wird.
Und noch einmal: je mehr Sensoren, desto besser. Es ist großartig zu wissen, dass Sie immer ein Echtzeitwarnsystem auf Ihrer Seite haben werden. Noch besser ist es, wenn man sich ein computergeneriertes Modell ansehen kann, das von vielen Rack-Sensoren gespeist wird, sodass man die Ursache der Abweichung nachvollziehen kann.
Lassen Sie Ihre Server sich auch keine Erkältung einfangen
In Anbetracht der Abwärme, die Server in der Regel erzeugen, machen sich weitaus weniger Manager von Rechenzentren Gedanken über kühlere Temperaturen als der Durchschnitt. Dennoch: Wenn die Temperatur unter 18,3 °C sinkt, wird es aus einem anderen Grund riskant.
Umgebungsluft kann bei niedrigeren Temperaturen weniger Feuchtigkeit aufnehmen. Folglich führt eine hohe relative Luftfeuchtigkeit in einer Umgebung mit niedriger Temperatur zu Kondensation. Und wie die meisten von uns aus dem Physikunterricht wissen, vertragen sich Wasser und Elektrizität nicht besonders. Feuchtigkeit kann der CPU und dem Motherboard eines Servers schnell und irreversibel zusetzen.
Daher ist es wichtig, die Temperatur des Rechenzentrums als Balanceakt zu betrachten. Wenn die Temperaturen ohne Berücksichtigung anderer Umgebungsvariablen, nämlich Feuchtigkeit und Taupunkt, sinken, birgt dies ein übermäßiges Risiko für Ihre Geräte. Außerdem gibt es selten eine Rechtfertigung für eine Kühlleistung, die die Lufttemperatur unter 18,3 °C fallen lässt. Das Letzte, was Ihr PUE-Verhältnis (Power Usage Efficiency, Effizienz des Stromverbrauchs) braucht, ist Energie, die für die Kühlung Ihrer Anlage unter die empfohlenen Temperaturen aufgewendet wird.
Um eine Situation zu vermeiden, in der sich Ihre Server „erkälten“, stellen Sie sicher, dass Sie Ihre Temperaturüberwachung durch ein Netzwerk von Feuchtigkeits- und Taupunktsensoren ergänzen. In Abstimmung mit Ihren Temperatursensoren werden die Manager des Rechenzentrums in Echtzeit benachrichtigt, wenn die relative Luftfeuchtigkeit oder die Temperatur einen Wert erreicht, der die Gefahr von Kondensation mit sich bringt. Umgekehrt kann die Luft, wenn die Luftfeuchtigkeit zu niedrig ist, trocken genug werden, um elektrostatische Ladungen zu induzieren, die empfindliche elektronische Komponenten beschädigen können.
Ja, Ihre geschäftskritischen Geräte für Rechenzentren bedürfen einer intensiven Betreuung. Das wird sich wahrscheinlich nicht ändern. Aber mit der umfassenden Überwachung von Rechenzentren wissen Sie genau, was Ihre Server genau benötigen, sobald sie es benötigen.