助け合いフォーラム

AWS

AWS ソリューションアーキテクト - アソシエイト(SAA-C03)

問題ID : 30182

バックアップデータの保存先をオンプレミスからAmazon S3に移行したい。下記の条件の場合、もっともコストパフォーマンスが高いストレージクラスはどれか。
・データは1年間以上保存する
・年に1回程度バックアップデータからデータを復元する
・データを取り出す時は数時間の遅延が発生しても問題ない

S3 Glacier Flexible Retrieval

S3 Standard-IA（S3 Standard-Infrequent Access）

S3 Glacier Instant Retrieval

S3 Intelligent-Tiering

正解

S3 Glacier Flexible Retrieval

解説

Amazon S3のストレージには利用者が目的に合わせて選択できるよう複数の種類（ストレージクラス）があります。
「S3 Glacier Flexible Retrieval」は大量のデータを低価格で保存できるアーカイブデータ向けストレージです。データ取り出し時に数分～数時間の遅延と取り出し料金がかかります。アクセス頻度が低く、取り出し時に遅延が発生しても問題ないデータに適しています。

したがって正解は
・S3 Glacier Flexible Retrieval
です。

[ストレージクラスの比較表]

その他の選択肢については、以下のとおりです。

・S3 Standard-IA（S3 Standard-Infrequent Access）
・S3 Glacier Instant Retrieval
即時にデータを取得できる分「S3 Glacier Flexible Retrieval」より保存料金が高価格です。
データの取り出しに遅延が発生しても問題ない場合は「S3 Glacier Flexible Retrieval」の方がコストパフォーマンスが高いので、誤りです。

・S3 Intelligent-Tiering
アクセスパターンに基づいてコスト効率の良いストレージ階層にデータを自動的に移動するストレージクラスです。どの階層で保存されていてもデータ取り出し料金はかかりませんが、監視とデータ移動の自動化に対する月額利用料がかかります。アクセス頻度が変動するなど予測が難しいデータに適しています。
アクセス頻度が年に1回程度と予測されている場合は「S3 Glacier Flexible Retrieval」の方がコストパフォーマンスが高いので、誤りです。

学習テキスト

Amazon S3

【Amazon S3（Simple Storage Service）】
Amazon S3（Simple Storage Service）は安価で耐久性が高い、フルマネージドのオブジェクトストレージサービスです。フルマネージドサービスとは、OSやソフトウェアのパッチ適用、バックアップや高可用性の設計、自動スケーリングなどをユーザーが意識せずに利用できるサービスのことです。

S3のストレージタイプである「オブジェクトストレージ」とは、ディレクトリのような階層構造を持たず、データに固有IDを付与した「オブジェクト」として扱うストレージのことです。オブジェクトに割り当てられる固有IDは「オブジェクトキー」と呼ばれ、各データはオブジェクトキーによって一意に特定できます。

【S3の構成要素】
「オブジェクト」が保存される領域を「バケット」と呼びます。一つのバケットにはオブジェクトを無制限で保存できます。バケット名はグローバルで一意にする必要があり、作成したバケットのバケット名は変更できません。各オブジェクトにはリージョン、バケット名、オブジェクトキーが含まれたURLが付与され、HTTP/HTTPS経由でS3オブジェクトへアクセスできます。また、オブジェクトキーの先頭部分にプレフィックスと呼ばれる文字列を付与することで、フォルダのような階層構造でオブジェクトをグルーピングすることも可能です。

【ストレージクラス】
Amazon S3のストレージには複数の種類（ストレージクラス）があります。ユーザーはデータへのアクセス頻度、必要とする可用性、最小保存期間などに応じて保存するストレージクラスを選択します。
オブジェクトアップロード時のデフォルトのストレージクラスは「S3 Standard」です。ストレージクラスは、オブジェクトの設定画面や後述するライフサイクルで変更できます。

[ストレージクラスの選択画面]

[ストレージクラスの比較表]

■ライフサイクル
S3バケット内のデータに対して、ストレージクラスの変更やオブジェクトの削除を自動化する機能です。指定した期間が経過したデータを自動的に、よりコストパフォーマンスの高いストレージへ移動したり、保管期限の過ぎたデータを削除したりできます。アクセス頻度が予測できるデータや、保管期間が決められているデータのバケットに設定することで、コスト削減の効果が期待できます。

下記の図では、オブジェクト作成から30日後に「S3 Standard-IA」へ、60日後に「S3 Glacier Flexible Retrieval」へ移動させるように、ライフサイクルを設定しています。

【S3のデータ保護】
S3には保存したデータが操作ミスなどによって喪失するのを防ぐ機能があります。

■バージョニング
バケットに保存しているオブジェクトの世代管理ができる機能です。バージョニングを有効にすると、オブジェクトの更新時には更新前と更新後の両方のオブジェクトが保存され、各オブジェクトに固有のバージョンIDが割り当てられます。オブジェクトの削除時には、オブジェクトを完全に削除する代わりに削除フラグを意味する削除マーカーが付与され、それが最新のバージョンとなります。バージョニングを利用することで、ユーザーが誤ってデータの上書きや削除をしてしまっても元のデータを復元できます。

[オブジェクトのバージョン表示画面]

バージョニングは非常に便利な機能ですが、前のバージョンのデータも保持するため、保存コストが増加する場合があります。ライフサイクルルールを設定することで「非現行バージョンが一定期間経過したら自動で削除する」「常に最新Nバージョンだけ残し、それより古いものは自動で削除する」といった運用が可能になり、不要な古いデータを残さずにコストを抑えることができます。
[オブジェクトのバージョン削除設定画面]

○MFA Delete
S3のバージョニング機能を使用して管理されているオブジェクトを削除する際に、MFAデバイスの認証が必要となる機能です。MFA（Multi-Factor Authentication：多要素認証）とは、ユーザーIDとパスワードでの認証の際に、追加でワンタイムパスワードや指紋などのバイオメトリクスを使用する認証方法です。MFAデバイスには、物理デバイス（例：YubiKey）と仮想デバイス（例：スマートフォンにインストールされたGoogle Authenticator）があります。
MFA Deleteを利用すると、ルートユーザー（AWSとの契約を行ったアカウント）のみが、世代管理されたデータの削除権限を持つようになります。MFA Deleteが有効になっているバケットのオブジェクトを完全に削除するには、ルートユーザーがMFA認証を行い、削除対象のオブジェクトのバージョンIDを指定します。これにより、誤った削除や不正アクセスによるデータ損失を防ぐことができます。

■オブジェクトロック
S3のバージョニング機能を使用して管理されているオブジェクトに対して、更新・削除を制限する機能です。オブジェクトロックは、主にオブジェクトが意図的に改ざん・削除されることを防止する目的で使用します。
オブジェクトロックには、保持期間が無期限の「リーガルホールド」と、期限付きの「リテンションモード」の2種類があります。

〇リーガルホールド
権限（s3:PutObjectLegalHold）を持たないユーザーに対して、リーガルホールドが解除されるまでオブジェクトを読み取り専用にします。権限を持つユーザーのみオブジェクトの更新・削除と、リーガルホールドの解除ができます。

〇リテンションモード
リテンションモードは「ガバナンスモード」と「コンプライアンスモード」に分かれており、どちらかを選択します。

・ガバナンスモード
権限（s3:BypassGovernanceRetention）を持たないユーザーに対して、指定した保持期間中オブジェクトを読み取り専用にします。権限を持つユーザーのみオブジェクトの更新・削除と、ガバナンスモードの解除ができます。

・コンプライアンスモード
ルートユーザーを含む全てのユーザーに対して、指定した保持期間中オブジェクトを読み取り専用にします。保持期間中はルートユーザーを含めてコンプライアンスモードを解除できません。

リーガルホールドとリテンションモードは、同時に両方を有効にすることもできます。例えば、リーガルホールドとリテンションモード1年で有効にした場合、1年後にリテンションモードが解除されても、リーガルホールドは継続されます。逆に、リテンションモードの保持期間中にリーガルホールドを解除しても、リテンションモードは継続されます。

【S3のデータ転送】
S3には、ユーザーからS3バケットへのアップロードや、S3バケット同士のデータ転送に使用する下記の機能があります。

■S3 Transfer Acceleration
ユーザーとS3バケット間のデータ転送を高速化する機能です。ユーザーと地理的に近いエッジロケーションを経由し、高パフォーマンスなAWSグローバルネットワークを通じてS3バケットへデータを転送するため、安定した高速転送が可能になります。

■マルチパートアップロード
S3バケットに保存できるオブジェクトの最大サイズは50TBですが、一度にアップロードできる最大サイズは5GBです。5GBを超えるファイルをアップロードするには「マルチパートアップロード」を利用します。
マルチパートアップロードは、単一のオブジェクトをパートといわれる複数のデータに分割して、S3バケットにアップロードする機能です。各パートはそれぞれ並列にアップロードされるので、アップロード時間を大幅に短縮できます。また、パートの一部に送信エラーが発生しても、他のパートへ影響を及ぼすことなくエラーが発生したパートのみを再送します。AWSではファイルサイズが100MB以上の場合は、マルチパートアップロードの使用を推奨しています。

マルチパートアップロード中に、ネットワークの障害、アプリケーションエラー、ユーザーによる中断が発生すると、マルチパートアップロードが不完全な状態になる可能性があります。この状態では、各パートのアップロードが完了していないため、ファイルを正常に使用できません。
また、不完全なパートがストレージに残り続けるため、不要なコストが発生します。対策として、ライフサイクルを使い、不完全なマルチパートアップロードを削除するポリシーを設定し自動的に削除することで、不要なストレージ使用量とコストを削減できます。

■S3レプリケーション
S3バケットのデータを異なるバケットへ自動的にコピーしたい場合に使用します。S3レプリケーションを設定すると、指定した他のバケットへ自動的にオブジェクトをコピーします。レプリケーション先は、同一AWSアカウントが所有するバケットでも、異なるAWSアカウントが所有するバケットでも指定できます。S3レプリケーションには、コピー先を同一リージョンのバケットにする「同一リージョンレプリケーション」と、異なるリージョンのバケットにする「クロスリージョンレプリケーション」があります。

下記の図では、米国西部（オレゴン）リージョンに新しいバケットを作成して、クロスリージョンレプリケーションを設定しています。

【S3のアクセス制御】
S3ストレージ内のバケットやオブジェクトは、デフォルトではバケットやオブジェクトを作成したユーザー（S3リソースの所有者）だけがアクセスできます。権限を制限されたIAMユーザーや、他のAWSアカウントからS3リソースへアクセスできるようにするには、S3リソースの所有者がオブジェクトやバケットへのアクセス制御を行います。

■バケットポリシー
バケットに直接アタッチするリソースベースのポリシーです。自AWSアカウントのIAMユーザー、グループ、ロールだけでなく、他アカウントに対してもバケットおよびオブジェクトへのアクセス権限を制御できます。また、アクセス元のIPアドレス、ドメインなどの条件付き制御も可能です。

■IAMポリシー（ユーザーポリシー）
自AWSアカウント内のIAMユーザー、グループ、ロールにアタッチするIDベースのポリシーです。また、アクセス元のIPアドレス、ドメインなどの条件付き制御も可能です。他アカウントには直接権限を付与できません。

■ACL（アクセスコントロールリスト）
バケットおよびオブジェクトごとに設定するアクセス制御機能で、AWSアカウント単位で許可設定をします。他のAWSアカウントに対してアクセス制御ができますが、他アカウント内の特定IAMユーザー、グループ、ロール単位の指定や、アクセス元のIPアドレス、ドメインなどの条件制御はできません。AWSでは現在ACLの使用は非推奨で、バケットポリシーとIAMポリシーによる管理が推奨されています。

■S3アクセスポイント
S3アクセスポイントは、既存のS3バケットに専用のエンドポイントを作成できる機能です。1つのバケットに複数のアクセスポイントを設け、それぞれに個別のアクセス制御ポリシー（アクセスポイントポリシー）を設定できます。これにより、部門やアプリケーションごとに異なるアクセスルールを独立して管理可能で、バケットポリシーが複雑化するのを避けられます。
従来はバケットポリシーに要件ごとのアクセス制御を追加していく必要があり、設定が長大化して管理や修正が難しくなることが課題でした。アクセスポイントを利用すると、ポリシーをアクセスポイント単位で分割できるため、修正時の影響範囲を把握しやすく、設定内容も見やすくなるため、ポリシーの運用管理が容易になります。

○マルチリージョンアクセスポイント
S3マルチリージョンアクセスポイントは、複数のリージョンに配置されたS3バケットへの統一的なアクセスポイントを提供することで、パフォーマンスと可用性を向上させる機能です。マルチリージョンアクセスポイントを作成すると、S3は自動的に1つのグローバルなアクセスポイント（グローバルエンドポイント）を生成し、クライアントはグローバルエンドポイントを通じて複数リージョンのバケットにアクセスできるようになります。グローバルエンドポイントに届いたリクエストは、AWSグローバルネットワークを経由して転送され、マルチリージョンアクセスポイントで設定したバケットのうち適切なバケットにルーティングされます。

[マルチリージョンアクセスポイントのイメージ]

マルチリージョンアクセスポイントには、自動ルーティングとフェイルオーバーコントロールの2つの主要機能があります。
・自動ルーティング
クライアントの位置やリージョンの稼働状況に応じて、最も近くかつアクティブなルーティングステータスを持つS3バケットに自動的にリクエストをルーティングすることで、ネットワーク遅延を最小化し、パフォーマンスを向上させます。

・フェイルオーバーコントロール
フェイルオーバーコントロール機能を使用してリージョン間のトラフィックを制御できます。また、アプリケーションの耐障害性テストやディザスタリカバリシミュレーションも実行できます。

マルチリージョンアクセスポイントの構成パターンには、次の2種類があります。
・アクティブ/アクティブ構成
複数のリージョンが同時にアクティブ状態で稼働している状態で、リクエストは自動ルーティングによって、ユーザーに最も近くかつアクティブなリージョンに送信されます。トラフィックが中断した場合は、アクティブリージョンのいずれかに自動的にリダイレクトされます。

・アクティブ/パッシブ構成
プライマリリージョン（アクティブ）ですべてのリクエストを処理し、計画的または計画外のフェイルオーバー時にのみ待機中のリージョン（パッシブ）がアクティブになってデータがルーティングされます。

【S3のデータ暗号化】
S3のバケットやオブジェクトはデフォルトで暗号化されます。S3のデータ暗号化には「サーバー側の暗号化」と「クライアント側の暗号化」の2種類の方法があります。

○サーバー側の暗号化（Server-Side Encryption:SSE）
データがS3に保存されるタイミングで自動的にS3が暗号化を行います。データを取り出すときはS3がデータを復号して、ユーザーに渡します。

サーバー側の暗号化には、以下3種類の方法があります。

・S3が管理している鍵を使用する (SSE-S3)

・AWS KMS（AWS Key Management Service）に保存されているKMSキーを使用する (SSE-KMS)

・ユーザーが管理している鍵を使用する (SSE-C)

○クライアント側の暗号化
データをS3へアップロードする前にクライアント側で暗号化を行い、暗号化したデータをそのままS3に保存します。データを取り出すときは、暗号化したデータをS3からダウンロードした後、クライアント側で復号します。

クライアント側の暗号化には、以下2種類の方法があります。

・AWS KMS（AWS Key Management Service）に保存されているKMSキーを使用する

・クライアント側に保存したルートキーを使用する

■転送中のデータ保護
転送中のデータを保護するには、SSL/TLSと呼ばれる暗号化通信プロトコルを利用できます。S3ではTLSをサポートしており、S3バケットポリシーでaws:SecureTransport条件を設定すると、HTTPS（TLS）のみを許可して安全にデータを転送できます。

【その他S3の機能】
S3には保存したデータに対する様々な機能があります。下記では代表的な機能を紹介します。

■静的Webサイトホスティング
バケットに保存している静的コンテンツ（HTMLやJPGなど）をWebサイトとして公開できる機能です。静的Webサイトホスティングがサポートしているコンテンツには、JavaScriptなどクライアント側で実行されるスクリプトも含みますが、PHP、JSP、ASP.NET などサーバー側で実行されるスクリプトは含みません。
Webサイトとして公開したい静的コンテンツのあるバケットは「静的Webサイトホスティング」を有効にし、バケットをパブリックに読み取り可能になるよう設定します。

[静的Webサイトホスティングの設定画面]

■署名付きURL
S3の署名付きURLは、非公開設定されたオブジェクトに対して有効期限付きのアクセスを許可できる仕組みです。オブジェクトの所有者が持つ認証情報を使ってリクエストに署名を埋め込み、短時間だけ有効なアクセス権をURLに含めます。署名付きURLを使用すると、AWSアカウントを持たないユーザーや、恒久的な権限が付与されていないAWSサービスでも一時的にオブジェクトへアクセス可能になります。また、オブジェクトのダウンロードの他、アップロード用のURLも発行可能です。
署名付きURLには非常に長いランダムな文字列が含まれるため、URLを知らない第三者が推測することは現実的に困難です。しかし、ユーザー認証の仕組みはないため、URLが漏洩すると誰でもアクセスできてしまいます。

■S3イベント通知
S3バケットに発生したイベント（オブジェクトの作成や削除など）をトリガーに通知を行う機能です。通知先はLambda関数、SQSキュー、SNSトピック、EventBridge（※）です。例えば、S3バケットにオブジェクトが作成されたらLambda関数を呼び出すといった利用方法があります。
（※）Lambda関数、SQSキュー、SNSトピック、EventBridgeに関しては、それぞれ「Lambda/API Gateway」「SQS」「SNS」「基礎知識」分野で学習します。

■S3 Storage Lens
S3バケットのストレージ使用状況やアクティビティに関するメトリクスを可視化する機能です。複数のアカウントやリージョンにまたがるS3の利用状況を一元的に把握できるダッシュボードを提供し、組織全体のストレージの使用傾向やストレージコストの課題を把握できます。
また、ストレージの最適化やコスト削減、データ保護の改善に役立つ推奨事項（例：ライフサイクルの適用）も提示され、S3の運用改善に活用できます。

■リクエスタ支払い
Amazon S3のオブジェクトへアクセスする際に発生する転送料金は、通常S3バケットの所有者が支払います。S3オブジェクトを共有する際にバケットの所有者が転送料金を負担したくない場合は、バケットを「リクエスタ支払い」に設定するとアクセス元に対して転送料金が請求されるようになります。

■S3 Glacierの復元リクエスト
S3 Glacierストレージクラスに保存されているデータを「アーカイブ」といいます。「S3 Glacier Flexible Retrieval」と「S3 Glacier Deep Archive」に保存されているアーカイブは直接ダウンロードできないので「復元リクエスト」を行い一旦S3バケットに取り出します。復元リクエストには取り出し時間と料金に応じて3つのオプションがあります。

・標準取り出し
「S3 Glacier Flexible Retrieval」「S3 Glacier Deep Archive」に保存されているデータを取り出す際のデフォルトのオプションです。データの取得に通常で数分～数時間かかります。

・迅速取り出し
追加料金を払って標準取り出しよりも迅速にデータを取り出せます。「迅速取り出し」オプションは250MBまでのデータであれば通常1～5分以内に使用可能になります。迅速取り出しは「S3 Glacier Flexible Retrieval」のみ選択できます。

・大容量（バルク）取り出し
大容量のデータを取り出す場合に、標準取り出しより時間がかかりますが取り出し料金が低価格になります。ペタバイト単位のデータを1日かけて取り出します。

上に戻る

参考URL

AWS Amazon S3「Amazon S3 ストレージクラス」：Amazon S3 Glacier Flexible Retrieval (旧 S3 Glacier)

DevelopersIO produced by Classmethod「AWS再入門ブログリレー Amazon S3編」：S3 Glacier Flexible Retrieval

AWS Amazon S3「Amazon S3 の料金」

上に戻る