LANスイッチネットワークで起こる問題の主たる要因の一つとして、レイヤー2(L2)ループ構成がある。今回は、LANスイッチによるネットワークで陥りやすく大きな通信障害となり得る、ネットワーク設計の時点でのループ構成に対する十分な検討の必要性と、その対策の重要性について述べる。

 ネットワーク担当者なら、ループ構成によりブロードキャストストームが発生し、業務通信がすべて停止してしまったという事故を、耳にしたことや体験したことがあるだろう。しかしその対策の重要性と、対策を取ったネットワーク構築の必要性を十分に理解している人はどれだけいるだろう。

業務処理さえ止めるループ

 A社のサーバールームには、業務で使うグループウエアやWebポータル・サイトなどのために、いくつものサーバーが設置されている。ここに新規業務用のサーバーとそれを接続するためのLANスイッチを追加導入した(図1上)。LANスイッチには既存のサーバーを接続しているのと同じ機種を選択し、レイヤー3(L3)スイッチに接続するよう工事業者に依頼した。

図1●小さな接続ミスが大きなダメージを与える
A社は新設した業務サーバーがダウンを繰り返した(上)。原因はループ構成によりブロードキャストストームができていたためだった(下)。
[画像のクリックで拡大表示]

 接続がすべて終わり、確認のため新規業務サーバーにアクセスしたが、接続がうまくいかない。サーバーを確認すると起動していたはずの業務プロセスが停止していた。業務アプリを正常に起動させても、しばらくするとまた応答が返ってこなくなる。サーバーを確認すると、プロセスが停止していた。ネットワークから切り離した状態だと正常な動作を続けるため、問題個所の疑いはネットワークに向けられた。

 ネットワークを調査すると、LANスイッチのポートのLEDが激しく点滅していた。このLEDは通信中に点滅することから、ブロードキャストストームが発生していると推測できた。

 新規導入部分を中心に調べてみると、工事業者が誤って、L3スイッチと新規導入したL2スイッチを2本のLANケーブルで接続していたことが分かった(図1下)。この個所がループ構成となって、L3スイッチとL2スイッチの間にブロードキャストストームが生じてしまったのだ。これにより、トラフィック量が増大し、新規導入したサーバーの業務プロセスがダウン。業務サービスが数時間停止してしまった。

 ループ構成が引き起こす通信障害(ループ障害)はいくつかある。ブロードキャストストームによる通信帯域の圧迫、トラフィック増大によるルーターなどのネットワーク機器やサーバーの過負荷、LANスイッチのMACアドレス学習異常などだ。

 A社の場合は、サーバーの動作が不安定なことに着目してサーバー側の調査から始めたため、解決まで時間を要した。ブロードキャストストームが起こっていることは確認できても、どの個所がループ構成となっているのかを特定するのが困難な点も、ループ障害のやっかいな特徴の一つである。

この先は会員の登録が必要です。今なら有料会員(月額プラン)登録で6月末まで無料!

日経 xTECHには有料記事(有料会員向けまたは定期購読者向け)、無料記事(登録会員向け)、フリー記事(誰でも閲覧可能)があります。有料記事でも、登録会員向け配信期間は登録会員への登録が必要な場合があります。有料会員と登録会員に関するFAQはこちら