OpenResty XRay は、動的トレース技術に基づく非侵入型の診断システムです。従来の APM エージェントとは異なり、デフォルトではターゲットプロセスに対してコードの注入や改変を一切行いません。ユーザーが分析を開始した場合にのみ、OpenResty XRay エージェントは必要に応じて低頻度でデータを収集します。このオンデマンドサンプリングという設計思想により、本番環境における極めて低いオーバーヘッドと高い安全性が本質的に担保されています。

本番環境でリアルタイムに稼働している Rust アプリケーションのパフォーマンス分析において、最大の懸念事項は分析ツール自体が引き起こすオーバーヘッドです。本稿では実測データをもとに、OpenResty XRay エージェントが本番モードで Rust アプリケーションに対して動的トレース分析を実行した際の、システム CPU・メモリ・負荷、およびアプリケーションのスループットとリクエストのレイテンシへの実際の影響を詳細に示します。

計測データが示すとおり、エージェントがフル稼働している期間においても、アプリケーションの最大スループットへの影響はわずか 2.2%、平均リクエストレイテンシへの影響はわずか 1.12 マイクロ秒にとどまります。また、OpenResty XRay エージェントは分析タスクを実行していない場合、パフォーマンスオーバーヘッドは一切発生しません。

テスト環境とパフォーマンスベースライン

比較基準を確立するため、プロファイラーの実行前に top コマンドでシステムのパフォーマンスベースラインを計測しました。以下の図に示すとおり、対象の rocket-server プロセス(Rust製アプリケーション)のCPU使用率は約 73%、システム全体の直近1分間のロードアベレージは 0.86、CPUアイドル率は約 74.3%、空きメモリは約 1566 MB でした。

Rustプロセスのベースライン

分析期間中:システムレベルのリソース変化の観測記録

実際の診断シナリオを再現するため、OpenResty XRay コンソールから、プロダクションモードにて対象のRustプロセスに対し、300秒(5分間)の「High CPU usage」シナリオ分析を実施しました(操作パス:Guided Analysis → High CPU usage → 対象プロセスを選択)。

分析器実行中のシステム指標

「プロダクションモード」の選択はきわめて重要です。同モードは本番環境向けに設計されており、低頻度のサンプリングをはじめとする各種最適化により、システムへのパフォーマンス影響を最小限に抑えることを目的としています。ただし、その分、分析に要する時間が長くなる場合があります。

プロファイラーの実行期間中、システムの各指標にわずかな変化が観測されました。

  • 対象プロセスのCPU使用率~74% に上昇。ベースラインと比較して1ポイント未満の増加にとどまりました。
  • システム全体の直近1分間のロードアベレージ0.92 に上昇。従来の0.86から0.06の増加となりました。
  • CPUアイドル率~74.5% を維持。ベースラインの74.3%とほぼ変わりませんでした。
  • 空きメモリ~1564 MB に低下。約2MBの減少にとどまり、実質的な変化は見られませんでした。

分析器実行中のシステム指標

分析器実行中のシステム指標

以上の結果から、OpenResty XRay のプロファイラーはサンプリング期間中、CPU・メモリ・ロードアベレージといったシステムレベルのリソースに一定の影響を与えるものの、その影響は軽微であり、システムの安定稼働を損なうことはありませんでした。

主要指標:スループットとレイテンシへの影響の精密測定

本番サービスにおいて、スループットとレイテンシはパフォーマンスを評価する上で最も重要な指標です。本検証では、この 2 つの主要指標について、3 種類の比較テストを実施しました。

1. 最大スループット

負荷テストツールを使用して、各状態におけるサーバーの最大スループットを測定しました。

  • OpenResty XRay の Agent がインストールされていない場合、最大スループットは毎秒約 56,600 リクエストです。
  • Agent がインストール済みでプロファイラーが未実行の場合、最大スループットに変化はありません。
  • プロファイラーがサンプリング実行中の場合、最大スループットは約 55,300 RPS となり、サンプリングなしの場合と比較して 2.2% の低下にとどまります。

この結果から、プロファイラーの実行が対象プロセスの最大スループットに与える影響は極めて小さいことが確認されました。

プロファイラー実行時のスループット

2. 平均リクエストレイテンシ

サンプリング実行中におけるリクエストレイテンシへの影響を測定しました。

  • OpenResty XRay の Agent がインストールされていない場合、平均リクエストレイテンシは 37.79 マイクロ秒です。
  • Agent がインストール済みでプロファイラーが未実行の場合、平均リクエストレイテンシに変化はありません。
  • プロファイラーが実行中の場合、リクエストレイテンシは 38.91 マイクロ秒となり、1.12 マイクロ秒 の増加にとどまります。

この結果から、プロファイラーの実行が対象プロセスのリクエストレイテンシに与える影響も極めて小さいことが実証されました。

プロファイラー実行時のリクエストレイテンシ

まとめ

システムリソース、アプリケーションスループット、リクエストレイテンシの包括的な測定結果から、OpenResty XRay の動的トレーシングアーキテクチャは、本番環境の Rust アプリケーションに対してリアルタイム診断を実施する際のパフォーマンスオーバーヘッドが定量化・予測可能であり、主要なビジネス指標への影響が極めて軽微であることが確認されました。これにより、本ツールが本番環境において安全・安心に継続的に活用できるパフォーマンス分析ツールであることが実証されました。

Insights および Dashboard ページにおける自動分析のオーバーヘッドも、同様に極めて低く抑えられています。

OpenResty XRay について

OpenResty XRay動的トレーシング製品であり、実行中のアプリケーションを自動的に分析して、パフォーマンスの問題、動作の問題、セキュリティの脆弱性を解決し、実行可能な提案を提供いたします。基盤となる実装において、OpenResty XRay は弊社の Y 言語によって駆動され、Stap+、eBPF+、GDB、ODB など、様々な環境下で複数の異なるランタイムをサポートしております。

著者について

章亦春(Zhang Yichun)は、オープンソースの OpenResty® プロジェクトの創始者であり、OpenResty Inc. の CEO および創業者です。

章亦春(GitHub ID: agentzh)は中国江蘇省生まれで、現在は米国ベイエリアに在住しております。彼は中国における初期のオープンソース技術と文化の提唱者およびリーダーの一人であり、Cloudflare、Yahoo!、Alibaba など、国際的に有名なハイテク企業に勤務した経験があります。「エッジコンピューティング」、「動的トレーシング」、「機械プログラミング」 の先駆者であり、22 年以上のプログラミング経験と 16 年以上のオープンソース経験を持っております。世界中で 4000 万以上のドメイン名を持つユーザーを抱えるオープンソースプロジェクトのリーダーとして、彼は OpenResty® オープンソースプロジェクトをベースに、米国シリコンバレーの中心部にハイテク企業 OpenResty Inc. を設立いたしました。同社の主力製品である OpenResty XRay動的トレーシング技術を利用した非侵襲的な障害分析および排除ツール)と OpenResty XRay(マイクロサービスおよび分散トラフィックに最適化された多機能ゲートウェイソフトウェア)は、世界中の多くの上場企業および大企業から高い評価を得ております。OpenResty 以外にも、章亦春は Linux カーネル、Nginx、LuaJITGDBSystemTapLLVM、Perl など、複数のオープンソースプロジェクトに累計 100 万行以上のコードを寄与し、60 以上のオープンソースソフトウェアライブラリを執筆しております。

翻訳

英文版の原文と日本語訳版(本文)をご用意しております。読者の皆様による他の言語への翻訳版も歓迎いたします。全文翻訳で省略がなければ、採用を検討させていただきます。心より感謝申し上げます!