7月17日 サーバー停止 ML110 G6 Upper Critical Going,Deassertionエラー
梅雨が明けたとたん暑い日が続いていますね
毎日のこの暑さで僕もバテバテです
という挨拶はほどほどに、実は本日サーバーが停止していました
ご覧頂いた皆様には申し訳ありませんでしたm(_ _)m
どうやら、AM11時14分頃の停止のようです。
まぁ、いつもだったら僕もどうしようとか考えてしまうのですが・・・
今回の原因はすぐにはっきりしていたので気は楽?です。
SYS Ambient Temp Temperature
Upper Critical Going, Deassertion
上はマザーボードのIMPIイベントログです。
原因はそのエラーのまんまの意味で、
要は、熱くてやってらんねー
って事です
帰ってサーバーを見てみると、シャットダウンされていました。
Linuxシステムログにはエラーは一切無く正常終了だったのでUPSあたりがシャットダウンコマンドでも発行したか??
と思ったのですが犯人はマザーボードでした。
うちのサーバーML110 G6は、 サーバー専用機でとても安定している素晴らしいサーバーです。
ただねぇ・・・
サーバーマシンはだいたいどれもとてもデリケートです。
各種センサーや、異常監視機能、普通のパソコンよりも少しばかり余計に付いています
本当のサーバールームとかは、温度管理はばっちりですもんねぇ・・・
省エネ、節電が騒がれる中、無人となった自室のサーバーラックに空調が入るわけがありません
原因はわかっていても、結果この猛烈な暑さにお願いをする以外に方法がないところが歯がゆいところです。
エラーからして、CPUでも、HDDでもなく、チップセットシステム温度のエラーらしいので空冷の限界といったところでしょうか。
そもそもシステム温度は上限が48度設定となっていますので、もともと閾値が低いようです。
その閾値の設定変更は出来ないようです。
ただLight-Out 100で、閾値を超えたときの動作設定が出来るようなので設定を変更してみました。
PEF Configrationで、Power OffをDisabledにしましたが、さて今度はうまくいくでしょうか。
本来はこんな危ない設定をするより、冷やす方法を考えなければなりません。
ただ、天候のすることなら致仕方有りません。
何せ天災みたいなモンですから・・・
ケースのエアフローを考えるとか多少出来ることもありますが、部屋の温度を下げることが抜本的な改善方法だと思っています。
流石に無人の部屋のエアフローを改善させるとホームセキュリティー 的にいまいちどうなの??って話で。
その高温になった部屋という箱の中に設置されている、サーバー筐体のエアフローを改善したところでたかがしれています
この設定でマザーボードがやられたらそれも天候のせいにして、新しいサーバーマシンでも・・・(ぁ
どうやらML110 G7もずいぶんお手頃価格なようだし・・・(ボソ
とかは全然考えていないです
・・・・
・・・・・・
考えていないですからねー
なににしても動く限りちゃんと使ってあげないとね
ML110 G7化はとりあえず置いておいても、ご利用して頂いてる皆様にご迷惑をお掛けしますので筐体エアフローは後日検討します
G7にしても、結局は暑さが原因なら改善はしないだろうし・・・
関連のありそうなエントリ