クラウド移行後も故障に備えた設計を

AWSユーザーが検討すべき4つの障害対策

クラウドをIaaSとして利用する場合、インフラはクラウド事業者が管理してくれますが、障害が発生しないかどうかはまったくの別問題。ミッションクリティカルなシステムのクラウド移行では、大規模障害を想定した対策が不可欠です。

※IaaSとは「Infrastructure as a Service」の略称で、サーバーやネットワークなどの物理環境をインターネット上で提供する仕組みのこと。

「AWSユーザーが検討すべき4つの障害対策」

icon クラウドベンダーの
責任範囲はインフラまで
IaaSの責任共有モデル(右図)(下図)では、OSより上位のソフトウェア領域に起因する障害は、ユーザー側で対応する必要があります。
icon SLAはあっても100%ではない
インフラについて、SLAが細かく設定されていますが100%ではありません。過去にはデータセンター規模の障害発生も…。

IaaSの責任共有モデルを考慮したシステム設計(単一障害点のない設計など)により、クラウドをIaaSとして利用する際のシステムの可用性を確保することが重要です。

仮想基盤 ハードウェア データセンター SLAはあっても100%ではない クラウドベンダーの責任範囲 アプリケーション ミドルウェア OS オンプレミス同様の対策が必要 ユーザーの責任範囲 IaaSの責任共有モデル

AWSユーザーが検討すべき
4つの障害対策

クラウドの中でも利用者の多いAWS環境で、
一般的によく使われる4つの障害対策をご紹介します。

  • マネージドサービスの
    活用

    AWSでは、複数データセンター間で冗長構成が可能なマネージドサービスや、インスタンスの自動復旧機能などが標準提供され、簡単に障害対策を実現できます。

  • 監視ツールの導入
    + 手動での復旧

    監視ツールを導入し、障害を検知したインスタンスを手動で再起動する対応も可能です。ただし、ダウンタイムが発生するため、ミッションクリティカルなシステムには不適です。

  • HAクラスター構成で
    システムを冗長化

    異なるデータセンター間でデータをリアルタイムに同期し、万が一の際、迅速な自動復旧を行う仕組みです。ダウンタイムを最小化し、ミッションクリティカルなシステムの高可用性を実現します。

  • バックアップ
    (スナップショット取得)

    クラウドにおいても、障害対策の基本はバックアップです。AWSではインスタンス全体のスナップショット取得によって、データを含め特定の時点を再現することができます。

ご紹介した4つの対策について
解説した資料をご用意しました。
AWS環境での障害対策に
お役立てください!