管理人のサイトで1つ利用しているアイルのiCLUSTERで障害が2008年1月9日に発生した。
まずはメールの送受信が全く出来ない。このような際には普通はセキュリティソフトを疑い、停止してみる。それでも駄目な場合は通常はOutlook2007を使っているのだが、念のためOutlookExpressにて送受信を試みるもののやはり駄目である。ということは、まさかサーバーダウンではと思い、アイルで利用しているドメインのWebページを開こうとしても開かない。念のため、ドメインにpingを打つと帰って来る。ということはサーバーは生きているなと思いつつアイルに問い合わせのメールを送信してみた。
何時から障害が発生しているのかを確認するため、Webサーバーのアクセスログを見たところ6:30くらいからのことが分かる。その後外出し昼過ぎに戻りメール送受信を行うと、いつもの通り。大量のスパムが届いてきた。アイルからのメールも来ており、「現在、障害発生中」とあった。
管理人のサイトは商用サイトではないので、大した被害はなかったものの(AdSenseで儲かっているので小損害か?)、大規模な商用サイトを運営している人は大変だなあ、など思っていたものだ。
ところで、本日アイルより詫び状が届いた。原因と対策についてであるが、これはサイト上でも公表していたものと同じだ。原因はサーバーとNASの間のL2スイッチがということである。通常はスパンニングツリーにて障害発生は回避出来ると思うのだが、全てのスイッチが死んでしまったのだろうか?pingを打てたことからもサーバー自体は生きていたことになる。
いやはや、大規模ネットワークの構築と保守は大変だ。
このエントリーにはコメントはありません。