製品・サービス

システム障害からの速やかな回復を実現するHAクラスターシステム

今日のエンタープライズにとって、情報システムはビジネスの基盤、企業活動そのもののプラットフォームとなっており、それが停止することは、業務や顧客サービスの停止、すなわちビジネスの機会損失を意味します。いったんシステムがダウンすると、復旧に数時間から数日を要するケースもあり、その間に失うものは取引そのものだけでなく、製品・サービスへの信頼下落や、ひいては企業として積み重ねてきた歴史やブランド価値そのものにも及ぶといっても過言ではありません。そのため、情報システムの信頼性を検討するにあたっては、そのシステムが支える業務の重要性とコストを鑑み、適切なレベル・方法での対策を設計することが重要です。

HAとは「High Availability」の略で、日本語では「高可用性」と訳されます。システムの役割はユーザーが必要とする時、常に使える状態にあることですので、故障やサーバーダウンをせず、正常に稼働し続ける能力、つまり稼働率を高く保つことを目指します。
一方、「クラスターシステム」(または「クラスタリングシステム」)とは、複数台のサーバーを協調動作させ、あたかも1台のようにふるまうシステムを指します。この仕組みにより、1台のサーバーに障害があっても、他のサーバーが作業を引き継ぎ、継続的に稼働することが可能になるのです。したがって、「HAクラスターシステム」とは、1台のサーバーでは得られない可用性の向上を目的とした、クラスターシステムということになります。

クラスターの種類

クラスターシステムは、大きく以下に分類が可能です。

  • 高速並列処理を目的とした「High Performance (HPC)クラスター」
  • 高可用性の実現を目的としたクラスター

高可用性の実現を目的としたクラスターは更に、

  • 本番系のサーバーに障害があった際に待機系への切り替えを行う「フェイルオーバークラスター」
  • 複数のサーバーを並べて平常時は負荷分散を行い、障害が発生したサーバーは自動的に切り離すことによって処理の継続を実現する「負荷分散クラスター」に分けることが可能です。

ここでは、可用性の向上策としての「フェイルオーバークラスター」に絞って見ていきます。

障害・災害からの復旧時間とHAクラスターの位置づけ

障害対策要件を検討する際、システムが再稼働するまでの時間であるRTO(Recovery Time Objective)とデータを戻す時点であるRPO(Recovery Point Objective)を考慮します。各ポイントを障害直前・直後に近づければ近づけるほど、障害が及ぼす業務への影響を小さくすることができますが、逆に投資額は大きくなります。したがって、システムごとにその復旧要件と、かけられるコストのバランスをとることが大切です。
今回は、RTOを考慮した代表的なソリューションであるHAクラスター(HAクラスタリング)とRPOを考慮したレプリケーションという2つのソリューションを見ていきます。

システム復旧を被災に近い時間(直後、直前)にするほど投資額は大きくなる

HAクラスター/HAクラスタリング

運用系、待機系に分けてサーバーやアプリケーションを二重化し、相互に監視します。運用系システムに異常が発生した時には、速やかに待機系に業務を引き継ぎ(=フェイルオーバー)、システムの稼働を継続します。またこの際、待機系のサーバーが運用系サーバーの業務を引き継ぐに当たっては、同じ状態の最新データを使える必要があるので、両サーバーからアクセス可能な共有ディスクを使用するか、レプリケーションという手段を使う必要があります。コストはかかりますが、人手を介さずに業務の継続性を高める手段として、多くの企業で採用されている方法です。また、HAクラスタリング・ソフトウェアは、このサーバーの自動切り替えを行うことで、復旧時間の短縮を可能にするソフトウェアです。

HAクラスター/HAクラスタリング

レプリケーション

サーバーを2台(または複数台)立て、リアルタイムでデータをコピー、同期する方法です。サーバーを遠隔地に置けば、広域災害に向けたディザスタリカバリ策にもなり、直近のデータへの復旧ができます。ただし、あくまでもデータ保護の施策ですので、サーバー・アプリケーションの再起動といった手作業が必要になり、障害状況によっては業務停止が発生します。このシステムを復旧させるために必要な業務停止の時間は、稼働しているアプリケーションやサーバーのパフォーマンスなど、稼働しているシステム環境に大きく依存します。

レプリケーション

HAクラスターの位置づけと導入に適したシステム

HAクラスターを導入したからと言って、復旧時間がゼロになるわけではありません。システムの要求水準によっては、さらに高いレベルの可用性を求められるものもあり得ます。可用性は、一般的に想定されるシステムの年間ダウンタイムの長さによって右記のように分類されますが、Availabililyクラスを上げるにはコストが掛かりますので、それぞれのシステムが許容する年間ダウンタイムを定義して判断する必要があります。
HAクラスターソフトウェアは、一般的に、フォールトレジリエントレベルの可用性を持つシステムを構築できるように設計されています。

Availability
クラス
Availability
レベル
年間
ダウンタイム
コスト
連続処理
(Continuous Processing)
100% 0分 高い
フォールトトレラント
(Fault Tolerant)
99.999% 5分
フォールトレジリエント
(Fault Resilient)
99.99% 53分
ハイ・アベイラビリティ
(High Availability)
99.90% 8.8時間
一般の商用
Availability
99-99.5% 44-87時間
低い

以上のことからHAクラスターに適したシステムは、多少の停止は許容できるが、何時間も止めることはできないもの、たとえばデータベース、Webサーバー、メールサーバー、ファイルサーバー、運用監視システム、業務システムといったものが挙げられます。また、HAクラスターソフトウェアはサーバーやOSだけではなく、そのうえで動く個別のアプリケーションを監視できるため、提供サービスに関わるアプリケーションが複数あるような業務システムも検討に入れるとよいでしょう。

もっと詳しく知りたい方

HAクラスター導入実践ガイド

仮想環境・クラウドでの可用性の課題を解決
HAクラスター導入実践ガイド

HAクラスターを取り巻く市場動向やHAクラスターの基本的なコンセプトや特徴の解説、クラウド時代の可用性向上の具体策についての情報が満載!

CONTENTS

  • HAクラスターを取り巻く市場動向
  • クラウド時代の可用性向上―サービスレベルに応じた具体策とは?
  • 低コストで可用性を確保するシングルサーバーの障害復旧サービス
  • HAクラスターの基本とLifekeeper
  • Linux版がだけじゃない 事業継続ソリューションのWindows Server対応
  • ユーザー事例 など
PAGE TOP