2017/02/02(木)ブレーカーが落ちて自宅サーバーが落ちる

冬の早朝.自宅のブレーカーが落ちてしまい,サーバーの電源が切れました.
UPS無停電電源装置)も付けていたんですが,このときまだ寝ていまして,ブレーカーが落ちたことに気がつかず…….
気がついたときにはサーバーは冷たくなっていました……….
UPSも5分くらいは大丈夫なので,これまで雷等による停電にはずっと耐えてもらっていたんですが,
停電時間が10分単位になるとどうしようもないですね*1

問題は復旧作業でした.ファイルサーバの復旧に時間を要したのです.
Webサーバー(このウェブページを運営しているパソコン)は常時無負荷で大したデータも入っていないのでいいのですが,
ファイルサーバは重要なサーバーです.
我が家のファイルサーバは大容量のハードディスクが所狭しとつながっているシロモノで,消えたら悲しくなるデータがたくさん入っています.

残念なことに,今回の停電が引き金になったかはわかりませんが,このファイルサーバのハードディスクが1台お亡くなりになりました!
あんまり残念そうでないのは,バックアップを取っていて消失したデータがなかったからです.備えあれば憂いなしですね*2

ただ,Linuxは一定の期間が経つと電源投入時にハーディスクの健全性をチェックするフルスキャンが強制的に実行されます.
今回はしばらく(1年以上?)電源を切っていなかったため,フルスキャンが始まってしまいました.
朝出掛ける前に電源を入れて,たぶん丸1日スキャンしていたのではないかと思います.
その後,壊れたハードディスクを設定ファイル上からコメントアウトして復旧が完了しました.
というわけで,手間はかからなかったものの時間はかかってしまいました.

予備のハードディスクを用意して早めにバックアップをしようと思います.

*1 : あとから追記.オムロンのUPSを使っていますが,メーカーからLinux向けの自動シャットダウンプログラムが配布されているので,それをインストールして工夫をすれば安全にパソコンをシャットダウンすることができます.完全に忘れていました.UPS1台でパソコン1台の組み合わせならソフトのインストール・設定だけで普通に使えます.UPS1台でパソコン複数台の場合はこのソフトの他に,自分でスクリプトを書く必要があります.私の環境は後者なので面倒くさくてやっていないだけでした.

*2 : このファイルサーバーには,同容量のハードディスクが2台ずつ組み込まれていて,それぞれに同じ内容のデータを保存しています.つまり1台ハードディスクが壊れてしまったとしても,データの損失は最小限に抑えられます.この方式はある意味で贅沢な運用方式ですが,障害からの復旧も早い(ひとまず壊れたハードディスクをアンマウントすればシステムは正常に起動する)し,RAIDの煩雑な作業もないので,小規模なネットワークでなら十分に使える方式だと思います.