CTC 教育サービス
[IT研修]注目キーワード Python Power Platform 最新技術動向 生成AI Docker Kubernetes
前回に続いて、2024年に公開された論文「Thesios: Synthesizing Accurate Counterfactual I/O Traces from I/O Samples」に基づいて、架空の構成のストレージシステムに対するI/Oトレースを生成するシステム「Thesios」について解説します。今回は、Thesiosが生成したデータの正確性を示す検証結果とThesiosの利用例を紹介します。
前回の記事では、Thesiosがアクセス予測データを構成した上で、ソフトウェアによるシミュレーションでI/Oリクエストの処理速度(レイテンシー)や消費電力を算出することを説明しました。論文内では、実際のシステムから取得したデータと、同じ構成に対する予測結果を比較することで、Thesiosの予測精度を検証しています。まず、図1は、約2,000台のハードディスクに対する1日あたり、および、1時間あたりの読み込みアクセス数を示したデータです。斜線が入っていないグラフが検証用のデータで、斜線が入ったグラフが予測結果を表します。L、TP、Otherは、I/Oリクエストの優先順による内訳です。上図は1日ごとの比較で、下図は1時間ごとの比較になりますが、いずれも的確な予測になっていることが読み取れます。

図1 読み込みアクセス数の予測結果(論文より抜粋)
そして、次の図2は、読み込み処理のレイテンシーの予測結果です。Latency-sensitive(L)とThroughput-oriented(TP)の2種類の優先順位のリクエストについて、50パーセンタイル、95パーセンタイル、99パーセンタイルの値を示しています。ここでは、ソフトウェアによるシミュレーション結果(Simulator)に加えて、実験用のサーバー用いたエミュレーションによる予測結果(Emulator)も示されています。また、「Simulator(no reorder)」はシミュレーションの際に、リクエストの優先順位による処理の順序変更を考慮しない場合の結果になります。優先順位が最も高い「Latency-sensitive(L)」では、優先順位を考慮しない場合にレイテンシーが大きくなっていることが読み取れます。

図2 読み込み処理のレイテンシーの予測結果(論文より抜粋)
続いて、Thesiosによる予測データの具体的な活用例を紹介します。まず、図3は、ディスクの使用率(ディスク容量の何%までデータが保存されているか)の制限値をあげた場合のレイテインシーの変化に関する予測結果です。

図3 ディスクの使用率を増加した場合のレイテンシーの変化予想(論文より抜粋)
既存の構成では、ディスクの使用率は50%に制限されていますが、これを70%、および、90%まで緩和した場合の予測結果になります。ディスク内のファイルが増加する事でディスクに対するアクセス数も増えるため、全体の平均(All-mean)では、レイテンシーが大きく悪化することが読み取れます。しかしながら、優先順位が最も高いアクセスについては、50パーセンタイル(L50)、95パーセンタイル(L95)、99パーセンタイル(L99)のいずれにおいてもレイテンシーの悪化はそれほど大きくありません。ストレージシステムの管理者は、このデータを元にして、許容されるレイテンシーの範囲内でディスクの使用率をどこまで緩和できるかが検討できます。
続いて、図4はディスクの回転速度を落とした場合のエネルギー消費量の変化予測を表します。図4の左は、Thesiosによる予測の精度を検証したもので、通常よりも回転速度が遅いハードディスクに対するレイテンシーについて、実測値と予測値を比較したものです。そして、図4の右は、Thesiosの予測結果に基づいて、ディスクの回転速度を標準的な7,200RPMよりも落とした際のアクセスのレイテンシーの変化と、エネルギー消費量の変化をまとめたものになります。

図4 ディスクの回転速度を落とした際のエネルギー消費量の変化予測(論文より抜粋)
この結果を見ると、ハードディスクの回転速度を落とす事で、レイテンシーが長くなる代わりに、エネルギー消費量が減少することがわかります。例えば、4,200RPMのハードディスクに置き換える事で、エネルギー消費量は73%に減少しています。このように、Thesisosを利用することで、エネルギー消費量に関する予測も可能になります。
今回は、2024年に公開された論文「Thesios: Synthesizing Accurate Counterfactual I/O Traces from I/O Samples」に基づいて、Thesiosが生成したデータの正確性を示す検証結果とThesiosの利用例を紹介しました。論文内では、本文で紹介した以外にも多数の予測結果が示されていますので、興味のある方は、実際の論文にも目を通してみてください。
次回は、キャッシュメモリアクセスの効率化を実現する、新しいCPUアーキテクチャーに関する話題をお届けします。
Disclaimer:この記事は個人的なものです。ここで述べられていることは私の個人的な意見に基づくものであり、私の雇用者には関係はありません。
[IT研修]注目キーワード Python Power Platform 最新技術動向 生成AI Docker Kubernetes