AWSユーザーが検討すべき4つの障害対策｜サイオステクノロジー株式会社

クラウド移行後も故障に備えた設計を

AWSユーザーが検討すべき4つの障害対策

クラウドをIaaS※として利用する場合、インフラはクラウド事業者が管理してくれますが、障害が発生しないかどうかはまったくの別問題。ミッションクリティカルなシステムのクラウド移行では、大規模障害を想定した対策が不可欠です。

※IaaSとは「Infrastructure as a Service」の略称で、サーバーやネットワークなどの物理環境をインターネット上で提供する仕組みのこと。

「AWSユーザーが検討すべき4つの障害対策」

クラウドベンダーの 責任範囲はインフラまで: IaaSの責任共有モデル（右図）（下図）では、OSより上位のソフトウェア領域に起因する障害は、ユーザー側で対応する必要があります。

SLAはあっても100％ではない: インフラについて、SLAが細かく設定されていますが100％ではありません。過去にはデータセンター規模の障害発生も…。

IaaSの責任共有モデルを考慮したシステム設計（単一障害点のない設計など）により、クラウドをIaaSとして利用する際のシステムの可用性を確保することが重要です。

クラウドの中でも利用者の多いAWS環境で、
一般的によく使われる4つの障害対策をご紹介します。

マネージドサービスの
活用

AWSでは、複数データセンター間で冗長構成が可能なマネージドサービスや、インスタンスの自動復旧機能などが標準提供され、簡単に障害対策を実現できます。
監視ツールの導入
＋手動での復旧

監視ツールを導入し、障害を検知したインスタンスを手動で再起動する対応も可能です。ただし、ダウンタイムが発生するため、ミッションクリティカルなシステムには不適です。
HAクラスター構成で
システムを冗長化

異なるデータセンター間でデータをリアルタイムに同期し、万が一の際、迅速な自動復旧を行う仕組みです。ダウンタイムを最小化し、ミッションクリティカルなシステムの高可用性を実現します。
バックアップ
（スナップショット取得）

クラウドにおいても、障害対策の基本はバックアップです。AWSではインスタンス全体のスナップショット取得によって、データを含め特定の時点を再現することができます。