ピーク容量イベントが発生する前に、 Google Cloud ワークロードで使用されるリソースを管理して最適化します。これには、実際の使用量と需要に基づくリソースサイズの適正化、動的リソース割り当てでの自動スケーリングの使用、アーキテクチャとセキュリティの推奨事項の確認が含まれます。Cloud Monitoring と Recommender(Active Assist)はどちらも、クラウド リソースの最適化の機会を特定する際に役立ちます。これらのツールを使用すると、リソース使用量に関する分析情報を取得し、イベントの前に十分な情報に基づいて意思決定を行うことができます。
Google Cloud ベスト プラクティスを確認する
ピーク容量イベントに関する多くの問題は、使用している Google Cloud プロダクトに推奨されているベスト プラクティスに従うことで回避できます。以下では、ベスト プラクティス ガイドの例を示します。
全般 | |
BigQuery | |
Cloud Storage | |
Compute Engine | |
Dataflow | |
Dataproc | |
Google Kubernetes Engine |
スケーラビリティを確認する
自動スケーリングを使用すると、オーバープロビジョニングと不要な費用を回避しながら、クラウドベースのアプリケーションにさまざまなワークロードを処理するために必要なリソースを確保できます。 Google Cloud では、次のようなプロダクト固有の自動スケーリング オプションがいくつか用意されています。
- Compute Engine マネージド インスタンス グループ(MIG)は、単一のエンティティとして管理およびスケーリングされる VM のグループです。MIG を使用すると、グループ内で維持する VM の最小数と最大数、自動スケーリングをトリガーする条件を指定する自動スケーリング ポリシーを定義できます。
- Google Kubernetes Engine(GKE)の自動スケーリングは、アプリケーションのニーズに合わせてクラスタ リソースを動的に調整します。リソース使用量の最適化、アプリケーション パフォーマンスの確保、クラスタ管理の簡素化を可能にするツールが用意されています。
- Cloud Run には、受信トラフィックに基づいてインスタンス数を自動的に調整する自動スケーリングが組み込まれています。
イベントの前に、手動でスケールアップすることをおすすめします。自動スケーリングが構成されている場合でも、イベント トラフィックの増加速度が速く、自動スケーリングが需要に追いつかない可能性があります。そのため、次のようなリソースを事前にウォームアップします。
- 仮想マシン
- キャッシュ(プリロードする場合)
- コールド スタートを防ぐサーバーレス コンポーネント
Active Assist の推奨事項を確認する
Active Assist は、 Google Cloud プロジェクトの最適化に役立つ推奨事項と分析情報を生成するためにGoogle Cloud で使用されるツールのポートフォリオです。詳細については、Active Assist とはをご覧ください。
プロダクトのバージョンを確認する
すべてのクラウド プロダクトとサービスが最新の安定版に更新されていることを確認します。
アラートとダッシュボードを確認する
Google Cloud Observability ツールとサードパーティ ソリューションから提供されるアラートとダッシュボードを評価して、問題を事前に特定し、対処します。
Google Cloud Observability の指標、ログ、トレースを確認して、リソースの使用量、パフォーマンス特性、リソースの全体的な健全性に関する分析情報を取得します。CPU 使用率、メモリ使用量、ネットワーク トラフィック、ディスク I/O、アプリケーションの応答時間など、システムの健全性指標に沿った重要な指標をモニタリングします。ビジネス固有の指標も検討する必要があります。これらの指標を追跡することで、潜在的なボトルネック、パフォーマンスの問題、リソース制約を特定できます。また、潜在的な問題や異常について、関連チームに事前に通知するアラートを設定することもできます。
アラートの場合は、重要な指標に焦点を当て、適切なしきい値を設定して「アラート疲れ」を最小限に抑え、重大な問題にタイムリーに対応できるようにします。このターゲット アプローチにより、ワークロードの信頼性を事前に維持することができます。詳細については、アラートの概要をご覧ください。