システムや機器は故障しないに越したことはありません。しかし,故障そのものの発生をなくすことには限界があります。そこで「故障は発生するものだ」ということを前提にして,あらかじめ冗長な構成を作っておき,万が一故障した場合に備えることがあります。

信頼性を向上させる方策

 冗長な構成を用意して信頼性を確保する手法は,総称してフォールトトレランス方式と呼ばれます。この方式で有名な実装方法には,デュアルシステムとデュープレックスシステムがあります。

 デュアルシステムは冗長系(予備機)を並行動作させておき,万が一トラブルがあった場合には故障した方を自動的に切り離してサービスを継続します。設備の投資コストがかかりますが,トラブル時のダウンタイムをほとんどゼロにできます。

 一方のデュープレックスシステムは,予備の機器を準備しておくだけで,通常は並行動作させません。そしてトラブル発生時に予備機を起動してそちらに切り替えます。こうしたシステムのため,トラブル発生時に直ちに使用できるとは限りません。予備機の待機状態をどのように運用するかによりますが,トラブル時に予備系への切り替え時間がかかる分,可用性の点がデュアルシステムよりも劣ります。

図1●フォールトトレランス方式
図1●フォールトトレランス方式

MTBF,MTTR,稼働率の関係

 システムの信頼度は,信頼性,可用性,保守性,保全性(完全性),安全性のそれぞれの視点から評価します。これら五つの視点は,英語の頭文字をとってRASIS(ラシス)(またはレイシスと読む)と呼ばれます。

 このうち最初の三つ「RAS(ラス)」は,それぞれの性質を数値化して比較できます。ここで登場するのが,MTBF,MTTR,稼働率です。

 RASのR(信頼性)を評価する際に使用するのが,MTBFです。システムや機器が故障して修理が完了してから次の故障が発生するまでの時間の平均,つまり稼働している時間の平均です。日本語では平均故障間隔と呼ばれます。

図2●信頼性評価の指針
図2●信頼性評価の指針

 一つ飛ばしてRASのS(保守性)を評価する際に使うのが,MTTRです。こちらは総修理時間を故障回数で割った値になります。日本語では平均修理時間と呼ばれます。

 そしてRASのA(可用性)を評価する際に使用するのが稼働率です。稼働率はMTBFを,MTBFとMTTRの合計値(つまり総時間)で割って算出します。

 例えば100時間動作して10時間修理,80時間動作して20時間修理,60時間動作して30時間修理と,それぞれの時間を要したシステムがあったとします。このとき,稼働率は0.8になります(下図の計算式を参照)。

図3●MTBF,MTTR,稼働率の計算法
図3●MTBF,MTTR,稼働率の計算法

出口 雄一(でぐち ゆういち)
株式会社タケキ IT教育事業部取締役
大手ソフトウエア・ベンダーを経て2003年に独立。現在はネットワーク技術講習会や情報処理技術者試験対策講座の講師を務める。テクニカルエンジニア(ネットワーク)やセキュリティアドミニストレーターなど数多くの国家資格を取得している。
出典:日経NETWORK2006年2月号 84ページより
記事は執筆時の情報に基づいており、現在では異なる場合があります。