助け合いフォーラム
正解
リードレプリカを作成し、参照クエリをリードレプリカに対して実行する
解説

検索クエリの同時実行数を増やしてもパフォーマンスが低下しないようにするには、検索クエリの同時実行数の増加に合わせてリードレプリカを増やし、検索クエリをリードレプリカに対して発行するようにします。
以上より正解は
・リードレプリカを作成し、参照クエリをリードレプリカに対して実行する
です。
その他の選択肢については以下の通りです。
・ストレージのオートスケーリングを利用し拡張が行われるようにする
RDSインスタンスのオートスケーリングは、データベースのストレージ容量に対して行われます。ストレージ容量を増やしても検索クエリの負荷は減らないので、誤りです。
・マルチAZを作成し、スタンバイデータベースインスタンスに対して参照クエリを発行する
マルチAZはデータベースの高可用性に関する設定で、異なるAZ(Availability Zone)にスタンバイデータベースインスタンスを作成します。スタンバイデータベースインスタンスは通常アクセスできないように設定されているので、誤りです。
・データベースエンジンをDynamoDBに変更する
DynamoDBはデータベースエンジンではなく、AWSのNoSQLデータベースサービスなので、誤りです。
参考
AWSには複数のデータベースサービスがあり、それぞれ異なる特徴や用途を持っています。

ユーザーは各サービスの特性を理解したうえで最適なものを選択する必要があります。
本項ではAmazon RDSについて解説します。
【Amazon RDS(Relational Database Service)】
RDSは、フルマネージド型のリレーショナルデータベース(関係データベース)サービスです。SQLを用いたデータベースの操作が可能であり、トランザクション処理にも適しています。リレーショナルデータベースでは、事前定義されたスキーマ(データの構造や制約の定義)に基づいてデータを管理します。そのため、ACID特性(原子性、一貫性、独立性、耐久性)を満たし、データの一貫性や整合性を保ちながら、複雑なトランザクションの実行が求められるシステムにおいても安心して利用できます。
RDSはフルマネージドサービスであり、AWSがデータベースの運用管理を担い、ストレージの拡張、高可用性の確保、バックアップ、パッチ適用、メンテナンスなど自動化しています。RDSを使うことでデータベース管理者はこれらの煩雑な作業から解放され、データベースの効率的な活用に注力することができます。
ただし、RDSはデータベースが稼働するシステム全体をAWSが管理してくれる代わりに、利用できるデータベースエンジンやバージョンが限定されています。また、データベースエンジンごとに使用が制限されている機能もありますので、利用する際は注意が必要です。
RDSには以下の特徴があります。
(1) 構築・運用負荷の軽減
(2) 高可用性
(3) パフォーマンス
(4) セキュリティ
(5) ACID特性
(1) 構築・運用負荷の軽減
以下はRDSの構築画面です(一部抜粋)。

RDSでは以下のようなデータベースエンジンを利用することができます。
- Aurora
- MySQL
- MariaDB
- PostgreSQL
- Oracle
- Microsoft SQL Server
- IBM DB2
その他、インスタンスクラス、ディスクサイズなどを選択するだけで利用可能になります。
運用上必要なレプリケーションの設定、バックアップ、スナップショット取得、パッチ適用などはAWS側で自動化または簡易化されており、ユーザーはこれらの運用負担から解放されます。
また、ストレージの自動スケーリングをサポートしており、ストレージ容量が枯渇した場合に自動的に拡張されます。ただし増えたストレージ容量は減らす(ストレージを縮小する)ことはできませんので注意してください。
・データベースの移行
現在利用しているデータベースをRDSへ移行する際も、できるだけ手間が少ないように考慮されています。
例えばMySQLを利用している場合、自社環境に保存されたバックアップデータを利用して移行が行える等の機能が提供されています。
また、スナップショットを用いてデータベースの復元や、データベースの移行(異なるDBエンジンへ移行する)を行う機能も提供されています。

以下はRDS for MySQLのスナップショットからAmazon Auroraへ移行する場合の画面例です。

・スナップショットの共有
RDSでは、データベースを所有しているAWSアカウントとは別のAWSアカウントと、データベースのスナップショットを共有できます。
例えば、AWSアカウントを別に持つ部署でデータベースのコピーが必要だったり、新たに作成するAWSアカウントへデータベースを移行したいような場合は、スナップショットを共有し、共有したAWSアカウントでスナップショットからデータベースを復元するといった運用が可能です。
なお、スナップショットが暗号化されている場合は(「(4) セキュリティ」参照)、KMSキーのキーポリシーの設定で、共有先のアカウントへKMS暗号化キーの使用を許可する必要があります。詳細は分野「KMS/CloudHSM」の「鍵の使用と鍵の共有」を参照してください。
・データベースのパラメータ変更
タイムゾーンや最大接続数、監査ログの有効化など、データベースの設定を変更したい場合、RDSでは「DBパラメータグループ(DBクラスターパラメータグループ)」または「オプショングループ」で定義します。
DBパラメータグループ、オプショングループはDBエンジンごとに作成するパラメータまたはオプションの定義グループで、作成後は複数のデータベース(またはデータベースクラスター)へアタッチできます。
(2) 高可用性
・マルチAZ
マルチAZ構成では、AZ(Availability Zone)をまたぐ配置によって同期レプリケーションとフェイルオーバーを実現することができます。

マルチAZでは、プライマリDBインスタンスとスタンバイDBインスタンスを2つの異なるAZに1つずつ配置することによって可用性を向上させることができます(リージョンは同一)。
スタンバイ側のデータベースは常に同期レプリケーションされているため、フェイルオーバーが発生してもデータの損失が発生しません。
またフェイルオーバーは自動的に行われ、運用は継続して行えます。データベースを利用しているアプリケーション側からはスタンバイ側へアクセスを切り替える必要もありません。
マルチAZはデータベースのメンテナンス(OSの更新やパッチの適用など)の時にも役立ちます。RDSはフルマネージド型のサービスのため、メンテナンスはAWSが行います。再起動を伴うメンテナンスはサービス停止が発生する場合があります。
このようなことを回避するにはマルチAZ構成を組むことが推奨されています。マルチAZ構成を取ることで、AWSが実行するメンテナンスは以下のように段階的に実行され運用停止なしにメンテナンスを完了することができます。
1. スタンバイDBインスタンスに対するメンテナンス
2. スタンバイDBインスタンスをプライマリDBインスタンスへ昇格
3. 新スタンバイDBインスタンス(旧プライマリDBインスタンス)に対するメンテナンス
マルチAZは、DBインスタンスの作成時に設定することができます。また、既にシングルAZで稼働中のDBインスタンスに対しても、最小限のダウンタイムのみで設定変更ができます。
・マルチAZ DBクラスター
Amazon RDSのマルチAZ DBクラスターは、マルチAZ構成の新しい高可用性オプションです。従来のマルチAZ構成とは異なり、3つのアベイラビリティゾーンにまたがって配置されるため、可用性がさらに強化されています。また、従来のマルチAZ構成ではスタンバイインスタンスにアクセスできませんが、マルチAZ DBクラスターでは2つのスタンバイインスタンスがリードレプリカとしても機能し、読み取りアクセスが可能です。プライマリーインスタンスへの書き込みは、残り2台のリードレプリカに準同期レプリケーションされます。さらに、フェイルオーバー時には通常35秒未満で切り替わるため、アプリケーションのダウンタイムを最小限に抑えることができます。
[マルチAZ DBクラスターのイメージ図]

(3) パフォーマンス
・インスタンスタイプ
RDSのパフォーマンスは、使用するインスタンスクラス(EC2のインスタンスタイプと同様)によって左右されます。インスタンスタイプは、アプリケーションの要件や負荷に応じて、計算能力(CPU)、メモリ、ネットワーク帯域の異なる複数のオプションから選択できます。一般的には、汎用(バランス型)、コンピューティング最適化、メモリ最適化などのクラスがあり、各クラス内でさらに小規模から大規模までのサイズが用意されています。
適切なインスタンスタイプを選択することで、データベースのパフォーマンスとコスト効率をバランス良く最適化することができます。
・ストレージタイプ
RDSのストレージは、基本的には汎用SSDとプロビジョンド(予約済み)IOPSから選択します。
IOPSとはInput Output per Second、つまり1秒間にどれだけI/O(Input/Output:読み取り/書き込み)が行えるかを意味するデータベースの性能指標です。
プロビジョンドIOPSを選択すると、予約したI/O性能が保証されるため、アクセスが集中する場面でも安定した性能を確保できます。
なお、両者の性能値は以下のように示されています。
- 汎用SSD: 100~10,000 IOPS
- プロビジョンドIOPS:1,000~30,000 IOPS
・リードレプリカ
RDSでは、リードレプリカ(RR)は参照専用のデータベースレプリカとして機能し、スケールアウトによって参照アクセスの負荷を分散するために使用されます。データベースの参照時にかかる負荷が高い場合、RRを最大15台までスケールアウトし、参照アクセスの負荷を分散できます。

リードレプリカは異なるAZや異なるリージョンにも配置でき、高可用性や災害復旧にも利用されます。
リードレプリカは、データベースのインスタンスクラスを変更することにより、スケールアップ(拡張)、スケールダウン(縮小)も柔軟に行うことができます。
利用者の多いタイミングでデータベースを一時的に拡張し、利用者が少ないタイミングでは縮小するように運用することにより、リソース(CPU、メモリ、ディスクI/Oやネットワークなど)を無用に消費せずに済みます。
※なお、本項で言及しているスケールアップ/ダウンはデータベースインスタンスが対象です。データベースのストレージ容量の拡張はできますが、縮小はできません。
(4) セキュリティ
・ネットワークアクセス制御
RDSは、Amazon VPC(Virtual Private Cloud:ユーザー用の仮想プライベートネットワーク空間)に対応しています。DBインスタンス作成時にパブリックアクセスを有効にしない限りは、VPC内でのみ利用可能なサービスです。
EC2インスタンスからのアクセスを行うパターンでは、RDSのデータベースインスタンス用のセキュリティグループを作成し、EC2インスタンスからのアクセスを許可するルールを作成して接続します。この設定により、ネットワークレベルでのアクセス制御が実現されます。
・データ通信の暗号化
さらに、アプリケーションサーバーとRDSインスタンス間の通信をSSL/TLSを使用して暗号化することで、両者間のデータ転送が保護され、盗聴や改ざんのリスクが軽減されます。これを実現するには、AWSが提供するルート証明書をダウンロードし、アプリケーションサーバー側でSSL/TLSを有効にしてRDSインスタンスへ接続することで、安全な通信を確保できます。

・データ暗号化設定
また、データベースインスタンスは、AWS Key Management Service(KMS)と連携して暗号化を行うこともできます。
※KMSの詳細は、分野「KMS/CloudHSM」を参照してください。
データベースインスタンスの暗号化を行うと、バックアップやスナップショット、ログ、RR(リードレプリカ)へも暗号化が行われます。
暗号化を行う場合はデータベースの作成時に指定します。

データベースの作成後に暗号化を有効にすることはできません。
暗号化されていないデータベースインスタンスを暗号化したい場合は、対象のインスタンスのスナップショットを作成し、スナップショットをコピーする際に暗号化を有効にします。暗号化されたスナップショットを基にデータベースインスタンスを復元すると、暗号化されたデータベースインスタンスが新規に構築されます。
(5) ACID特性
リレーショナルデータベースにはACID特性というものがあります。ACIDとは、原子性(Atomicity)、一貫性(Consistency)、独立性(Isolation)、耐久性(Durability)を意味する言葉で、更新処理中に中途半端なデータが書き込まれないことや、並行処理がそれぞれ独立して動作する(互いに干渉しない)ことなど、処理の信頼性を保証する性質をいいます。RDSもリレーショナルデータベースサービスですので、ACID特性を持っています。
[データベースの削除保護]
Amazon RDSデータベースやAmazon Auroraデータベースクラスタに対して「削除保護」機能を有効にすると、設定されたデータベースは削除ができなくなります。これにより、ユーザの操作ミスによる意図しない削除操作からデータベースを保護することができます。

【Amazon RDS Proxy】
Amazon RDS Proxyは、Amazon RDSおよびAmazon Auroraデータベースへの接続を効率的に管理するフルマネージドのプロキシサービスです。RDS Proxyをアプリケーションとデータベースの間に配置することで、データベース接続の管理を効率化し、アプリケーションのパフォーマンス、スケーラビリティ、および可用性を向上させることができます。特に、サーバーレスアーキテクチャやマイクロサービスアーキテクチャで使用されることが多く、頻繁なデータベース接続の確立や切断がパフォーマンスに影響を与えるケースに適しています。
[Amazon RDS Proxyの利用例]

主な特徴は以下です:
1.接続プーリング
RDS Proxyは接続プールを使用して、複数のデータベース接続を効率的に管理します。これにより、アプリケーションがデータベースに新しい接続を頻繁に確立および切断する必要がなくなり、データベースサーバーの負荷が軽減されます。また、一度確立したデータベース接続をプール内で保持し、必要に応じて再利用するため、接続の確立にかかる時間とリソースを節約することができます。
2.フェイルオーバーサポート
RDS Proxyはデータベースのフェイルオーバー時に接続を管理し、新しいデータベースインスタンスに自動的にルーティングします。さらに、マルチAZ配置もサポートしており、アプリケーションのダウンタイムを最小限に抑えることができます。
3.セキュリティ
RDS ProxyはIAMやSecrets Managerと統合して、データベースの認証情報を安全に管理します。これにより、データベース認証情報のセキュリティが強化され、アクセス制御も容易になります。
適切な対応について
本文において、問われているのは「適切な対応」となっています。
「オートスケールを利用し拡張が行われるようにする」については不正解となっていますが、その理由として記載があるのは
>パフォーマンスの改善にも役立ちますが、本設問では参照が多いことがわかっているため、まずはリードレプリカによる参照処理の負荷分散を行うのがよいでしょう。
となっています。問題に対してオートスケールはパフォーマンスの改善に役立つものであると思いますが、
「適切な対応」を問われているときに2つの回答が考えられる場合にリードレプリカによる参照処理の負荷分散が回答として望ましいとされる
根拠はなんでしょうか。本試験において常にコスト最適化は特に記載がない場合は回答条件として優先されるということでしょうか
設問のここの話ですね。
検索クエリの同時実行数が増えてもパフォーマンスが低下しないようにしたい
オートスケーリングって基本的に「負荷が上昇している」ときにリソースを増やして、「負荷が下降している」ときにリソースを減らすものですよね。DBアクセスにおいて負荷が上がる時って「追加、更新、削除」といったデータの変更に伴うCPUやDiskアクセスが増える場合か「変な検索によってストレージから大量にデータを読み出す」必要がある時なんですよね。ですが設問の状況は「検索クエリの同時実行数が増え」る場合なので、負荷が上がることよりも同時に処理できる数を増やすのが良いかなと。負荷が上がらず、でも同時接続、同時実行は多いという状態だったらオートスケーリングがなかなか発動しなくて効果がないこともありうるかなと思います。
例えばの話ですが
- 自動改札機は1人処理する単位時間や負荷は大きくないので、利用者が多いことがわかっているのであれば最初から多く設置しておく
- みどりの窓口は負荷が低い時は1人でやってるが、それぞれの対応ごとにやることや発見枚数や実施する作業が異なるので、負荷が高くて処理待ち(行列)ができたら都度対応者を増やしたり減らしたりする
というのに近いのかなぁと。
コメント
この投稿に対して返信しませんか?
m milkman
2023/07/16 12:09
ありがとうございます。 オートスケールについて、設問のようなケースの場合は他の回答より効果が出ないことが想定されるため、ということですね。よくわかりました。