Heroku Postgres データベースのチューニング
この記事の英語版に更新があります。ご覧の翻訳には含まれていない変更点があるかもしれません。
最終更新日 2024年04月24日(水)
Table of Contents
Heroku Data チームは、Heroku Postgres データベースが Web アプリケーションのワークロードに対して最適に設定されるように継続的に保証しています。具体的なワークロードを理解し、パフォーマンスチューニングを行うことによって、Heroku Postgres データベースのパフォーマンスをさらに向上させることができます。
適切な Heroku Postgres プランを選択する
適切なプランの選択は、アプリの固有の使用特性や、組織の可用性と稼働時間に対する期待によって異なります。詳細は、「Choosing the Right Heroku Postgres Plan」(適切な Heroku Postgres プランの選択) を参照してください。
Essential 層のデータベースは、可変のパフォーマンス特性を設計時点で備えています。アプリケーションが予測可能なパフォーマンスと可用性を必要とする場合は、データベースプランをアップグレードしてください。
メトリクスを追跡する
データベースのパフォーマンスを理解するための最初のステップは、各種の重要なメトリクスを追跡することです。これにより、システムのパフォーマンスの全体的なビューが提供されます。アプリケーションログに出力されるいくつかのシステムメトリクスが用意されています。これらのメトリクスは適切に追跡され、アラートが生成されます。それを行う 1 つの簡単な方法として、このデータを常に追跡する Librato アドオンをインストールします。
接続に注意する
メトリクスが設定されている場合は、接続数を常に監視します。データベース接続の漏洩のために一般的な問題が発生し、それにより、データベースのパフォーマンスか低下します。一部のフレームワークには接続を制御する方法 (ActiveRecord) など) がありますが、接続数がプラン制限に着実に近づいている場合は、pgbouncer を使用することも検討してください。
高コストのクエリを識別して修正する
データベースパフォーマンスの問題の最大の原因は、データベースシステムに大きな負荷をかける最適化されていないクエリから来ています。これらのクエリを識別するには、データベースの 「Expensive Queries」 (高コストのクエリ) ビューを調べます。さらに、Postgres は 2 秒より長くかかっているクエリをログに記録するように設定されているため、アプリケーションログも監視します。高コストのクエリが識別された後、多くの場合は適切なインデックスを追加することによって最適化できますが、最適なクエリを実現するために、データベーススキーマの調整が必要になります。個々のクエリの実行方法と、追加または削除されるインデックスを把握するには、常に EXPLAIN を使用します。
長時間実行クエリもまた、ロックを保持したり、それ以外の方法でサーバーリソースを過剰に消費したりするため、データベースパフォーマンスに影響を与える場合があります。長時間実行クエリは、各接続で SET statement_timeout = '20s'
を実行することによってセッションレベルで、または ALTER DATABASE your-database-name SET statement_timeout='20s'
を実行することによってデータベース全体のすべてのステートメントに対して自動的に中止できます。これは、データクリップなどの分析ツールの接続を含む、すべての接続に影響を与えます。
ロックを監視する
同じ行への並列書き込みにより、Postgres があるトランザクションをロックしたまま、もう一方のトランザクションは完了します。多数のロックにはデータベースの応答時間が低下する印象がありますが、実際には、ロックされたトランザクションはまったく動作しない状態のまま、適切なロックが付与されるのを待ちます。場合によっては、ALTER TABLE ステートメントを使用したデータベース移行が長い時間かかるように見えても、単に実行する順番を待っているだけのこともあります。
ロックを識別するには、pg-extras プラグインから使用可能な heroku pg:locks
コマンドを実行します。さらに、ロックの数はログストリームに記録されるため、Librato アドオンを使用して監視することをお勧めします。
データベースの肥大化を管理する
Postgres は、MVCC を使用してデータへの並列アクセスを可能にしています。これにより、最適に実行するためにデータベースシステムに対して VACUUM を実行する必要のあるデッドタプルまたは肥大化が発生する場合があります。Postgres には autovacuum デーモンが含まれていますが、より積極的なバキューム設定を設定することが必要になる可能性もあります。あるいは、肥大化を手動でクリーンアップするために、最小のトラフィックの時間帯にコマンド VACUUM ANALYZE
を頻繁に実行できます。
個別のキャッシングを検討する
Postgres はデータのキャッシングに優れていますが、アプリケーションによっては、Heroku Data for Redis などの個別のメモリ内システムでのキャッシングでメリットが得られる場合があります。特定のクエリが頻繁に実行され、応答時間が変化しやすい (これはキャッシングの影響を示している) 場合は、このアプローチを検討してください。
診断を実行する
heroku pg:diagnose
コマンドは、Heroku Postgres ユーザーで一般に発生する問題を知らせます。このコマンドの実行は、Heroku Postgres データベースで何らかの一般的な操作上の問題が発生しているかどうかを判定するための良い方法です。