障害復旧


このページでは、このサーバを運用していく中で遭遇した幾つかの 試練をどのように克服したか(?)を記録して行きたいと思います...。

事例1:ネットワーク障害(LANカードの熱暴走)

障害内容

2004年の夏は非常に暑かった...。Lib100本体の加熱により、本体PCMCIAスロットに2枚挿しされた LANカードが頻繁に止まるようになった。

対策

ヤフオクで購入したまま、押し入れで眠っていたポートリプリケータを利用した。このポトリを 利用すると本体の2スロット以外にプラス2スロットのPCMCIAを利用出来るのだが、こちらのスロット はポトリの左右に分かれていて、2枚のカードが接する事がなく、さらにカード上面に空間が空いて いて排熱の面でも効果が有ると思われる。という訳で、2枚のLANカードをポトリのPCMCIAスロット に挿して利用する事で対応した。

ただし、来年の夏には、やっぱりUSB接続のファンが必要になるような気がしている。

事例2:システムクラッシュ(マザーボード障害?)

経過

復旧手順

今回、たまたま障害発生の数時間前に外付ハードディスクにrsyncにてバックアップ を取得していたので、そこからリストアする方法を考えた。なお、以下の記述には 私の環境に依存した記述(IPアドレス、ディレクトリ名等々)が見受けられるが 御容赦願いたい。

バックアップ先のハードディスクはLibretto100と同一LANセグメント上の別マシン (192.168.0.97)の外付SCSIハードディスクとして接続されているので、リストア する為にはLibretto100側でリストア用のlinuxを起動し、pcmciaを認識させて ネットワークに接続させる必要がある。

ご存知のとおり、Librettoシリーズの外付フロッピーディスクは極々一部の 特殊なLinuxディストリビューションを除いてインストール時には使用できないので、 ちょっと工夫が必要になる。

懸案事項

今回、Libretto100の買い替えでCPUクロックが166MHzから233MHzにアップしているので、発熱への 耐性がさらに悪化していると思われる(^^;。USB接続のファン等の冷却装置の導入が必要か?。

事例3:ネットワーク障害(停電によるLANカード障害)

障害内容

2005年の冬の事でした。我が家では暖房器具に「エアコン」「電気カーペット」「ハロゲンヒータ」 を使っているのですが、これに追加して「湯沸しポット」「炊飯器」が頑張り始めると、かなりの 確立でブレーカが切れてしまいます。当初、Lib100はバッテリがあるので問題無いと思っていたの ですが、ブレーカ切断の直後に必ずネットワークが切れて、復電後も元に戻りません。

対策

原因ですが、なんとポトリにはLib100本体のバッテリからは給電されてないのでした。ですので、 停電時にはLANカードへの給電が絶たれてしまい、復電後も認識出来ないようになってたようです。 ですので、冬の間(ブレーカの切れる確立の高い間)は、熱暴走の可能性は低いので、本体PCMCIA スロットにLANカードを挿して運用する形態に戻しましたとさ...。
m-ito@myh.no-ip.org

[更新]