2008年02月08日

障害情報(2008/02/07)

原因不明の再起動とその後の自動再接続失敗のため、下記の時間このサイトに繋がらない状態になっていました。

停止時間:2月07日 06時35分〜23:00分頃まで

今回の停止時間は16時間半と過去2番目の長時間停止となってしまいました。

おまけにトリガになった再起動が全く原因不明(ログも残さず再起動が掛かってしまう状況)だったので、今後再発するおそれがありますので併せてご連絡致します。

メモとして調査済み項目リストです。

項目名調査結果可能性
瞬断やブラウンアウトUPS接続済み。また、近くにあった別のPC(UPS無し)は同時刻問題なく稼働。ただしUPS交換後に瞬断やブラウンアウトを経験していないのでUPSが正常に動作していなくて落ちた可能性は否定できない。低い
カーネルパニック/proc/sys/kernel/panicの値は0なので、カーネルパニックならそのまま固まるほぼ無い
HDD故障再起動前後にHDDの読み取りエラーなどはログにない低い
通常のソフトウェア的問題いろいろなログを見てみたが問題ない。唯一気になるのが、再起動直前に確認されたログがApacheのJPEGファイル送出だと言うことぐらい。しかし、今そのファイルを見ても何も問題ない。コアダンプなども見あたらないほぼ無い
自動処理の不具合その時間に実行されるジョブはない。直近のcronも全て正常終了済み無い
外的物理的要因異常なし低い
その他ハードウェア故障電解コンデンサ基板7年目・・・。高いorz
・・・同様の症状が出てまた原因が特定できなければ新しいサーバ構築予定です(*´д⊂)

Posted by Takuchan at 2008年02月08日 02:02 | トラックバック(0)