# 2J-4

# コア温度情報による細粒度パワーゲーティング制御を行う OSスケジューラ

木村 一樹†1 近藤 正章†2 天野 英晴 13 宇佐美 公良†4

> 佐藤 未来子†6 並木 美太郎†7

東京農工大学大学院工学府情報工学専攻<sup>†1</sup>/電気通信大学情報システム基盤学専攻<sup>†2</sup>/慶應義塾大学大学院理工学研究科<sup>†3</sup>/ 芝浦工業大学工学部情報工学科<sup>†4</sup>/東京大学大学院情報理工学系研究科システム情報学専攻<sup>†5</sup>/ 東京農工大学大学院工学府<sup>†6</sup>/東京農工大学大学院工学研究院<sup>†7</sup>

#### 1 はじめに

近年、システム LSI は高性能化の一方で消費電力の 増大が顕著な問題となっており、各分野で省電力化の取 り組みが行われている [1][2].

本プロジェクト[3]では、演算ユニットにランタイム パワーゲーティング (PG) 技術を施した MIPS R3000 ベースの CPU, Geyser の研究を行っている. Geyser ではハードウェアが自律的に PG を行うことが可能だ が、PG 実施時のオーバヘッドと電力削減量の損益分 岐点を考慮してソフトウェアで PG の実施方針を制御 することで、 省電力効果をさらに向上させることが期 待できる.

本研究では、この損益分岐点となるサイクル数がコ アの温度により変化することに着目し、 ランタイムにコ アの温度情報を取得して OS が PG 実施ポリシーの決定 を行う制御方式を提案する. 本稿では, 実際に FPGA ボード上に評価システムを構築した上で、本提案方式 を Geyser に実装し評価した結果を報告する.

## 2 Geyser 概要

Geyser では、ALU、SHIFT、MULT、DIV の各演 算ユニット対して命令サイクルごとの細かい粒度で動 的にパワーゲーティングを施すことができる.

# 2.1 PGStatus レジスタとスリープポリシー

パワーゲーティングの粒度をソフトウェア側から制 御するために、特権レジスタである PGStatus レジスタ を有し、パワーゲーティング対象の各演算ユニットに 対し、次の三つのスリープポリシーを定めることがで きる.

- 動的パワーゲーティング
- キャッシュミス時のみスリープ
- 常にアクティブ (スリープしない)

OS は PGStatus レジスタを活用し、細粒度パワーゲー ティングのスリープポリシーを制御可能である.

Fine Grain Power Gating Control with OS Scheduler Using Temperature Information of CPU Core

 $^{\dagger 1}$ Kazuki Kimura

Graduate school of Engineering, Tokyo University of Agriculture and Technology

 $^{\dagger 2}$  Masaaki Kondo Graduate School of Information Systems, The University of Electro-Communications

 $^{\dagger 3}$  Hideharu Amano Graduate School of Science and Technology, Keio University

<sup>†4</sup> Kimiyoshi Usami

Department of Information Science and Engineering, Shibaura Institute of Technology

<sup>†5</sup> Hiroshi Nakamura

Research Center for Advanced Science and Technology, The University of Tokyo

 $^{\dagger 6}$  Mikiko Sato Graduate school of Engineering, Tokyo University of Agriculture and

 $^{\dagger7}$ Mitaro Namiki

of Engineering, Tokyo University of Agriculture and Technology

#### 2.2 細粒度 PG の電力的特長

細粒度 PG によりユニットがアクティブとスリープ の間で状態遷移する際,電力のオーバヘッドが生じる. 特に期間が短いスリープが頻発する場合スリープによ る電力の削減量よりオーバヘッドが上回ることがある. このオーバヘッドに対しスリープによる省電力効果との 損益分岐点となるスリープ期間(サイクル数)を Break Even Point(BEP) と定義する. BEP より短いスリープ を抑制することにより、省電力効果を高めることが期 待できる. BEP の値はユニットにより異なり、また温 度によって変化する. BEP の値に関しては、本稿の実 験では先行研究 [4] により求めた値を用いる.

# コア温度情報を用いた制御方式の設計

## 3.1 スリープポリシーの制御

BEPは、図1に示すように、コア温度が高いほど短 く,低いほど長くなるという特性を持つ. そこで本方 式では、図2に示すようにユニットごとにある閾値温 度  $\theta_{TH}$  を定め、コア温度が  $\theta_{TH}$  より高い場合は「動的 パワーゲーティング」ポリシーを、低い場合は「キャッ シュミス時のみスリープ」ポリシーを設定することで 省電力効果の向上を図る.



図 1: 各ユニットの BEP の温度変化

## 3.2 スリープ頻度特性による閾値温度の設定

それぞれのユニットの $\theta_{TH}$ の設定には、スリープ頻 度情報を用いる. スリープ頻度情報とは, サイクル数 n のスリープに対するその回数  $m_n$  の度数分布である. 図3にスリープ頻度のイメージを図示する.

スリープ頻度情報  $T_{sleep} = \{t_{n,m} | n, m \in \mathcal{N}\}$  におけ る全スリープサイクル数

$$t_{sleepAll} = \sum_{t \in T_{sleep}} t \tag{1}$$

に対し,

$$\sum_{n=1}^{n_{TH}} (m_n \times n) = \frac{1}{2} t_{sleepAll} \tag{2}$$

なる  $n_{TH}$  を求める. この  $n_{TH}$  に対して, ユニットご とに図4に示すように $\theta_{TH}$ が得られる.



図 2: 温度閾値による PG ポリシー変更



図 3: スリープ頻度

図 4: BEP 対温度

スリープ頻度特性から nTH を求める方法には,

**方法1** アドミッションテスト (テストラン) により事前に得た情報を用いる方法

#### 方法2 実行時に動的情報を用いる方法

が考えられる.「方法 1」は実行時にスリープ頻度の測定のためのモジュールを必要としないものの,スリープ頻度の特性がタスクの性質によって異なるため,効率のよい制御がしにくいというデメリットがある.一方「方法 2」では実行時にスリープ頻度の測定のためのモジュールが必要だが,タスクの性質に応じた制御を行うことで省電力効果を効率よく向上させることが期待できる.そこで本稿では「方法 2」を用いる.

## 3.3 スリープ率による制御適用の判定

スリープ頻度の観測期間  $t_{All}$  に対し

$$\frac{t_{sleepAll}}{t_{All}} \tag{3}$$

を「スリープ率」と定義する。使用頻度が極めて低い ユニットは、温度によるスリープポリシー制御を適用 するより「常にPG」とした方が消費電力を抑えられる 場合がある。そこでスリープ率が高いケースでは「常 にPG」ポリシー固定とする。

#### 4 実装と評価

提案方式の PG ポリシー制御機構を,東京農工大学並木研究室で開発している組込み向け OS である Geyser OS[5] に実装した.また評価環境として FPGA ボード上に構築した Geyser による計算機環境,Geyser on FPGA を用いた.Geyser on FPGA はスリープ頻度の計測モジュールである PG パフォーマンスカウンタを含む各種入出力と主記憶を持つ.コア温度については, $25[^{\mathbb{C}}]$  から  $125[^{\mathbb{C}}]$  の範囲で変化する温度をエミュレーションした.また温度によるスリープポリシー制御を適用するスリープ率を 0.9 未満とした.

以下に、Geyser OS上で MATRIX、QSORT、Dhrystone の各種ベンチマークタスクを実行したケースの評価結果を示す.パワーゲーティングを行わなかった場合、提案方式による制御を行わず常に「動的 PG」とした場合、提案方式の制御を行った場合の平均リーク電力の比較を図5に示す.ALUやMATRIX実行時のMULTでは提案方式による制御でPG実施時のオーバヘッドを抑えた一方、MATRIX以外のMULTやDIV



図 5: 平均リーク電力



図 6: BEP ミス率

では動的 PG の効果が得られていることがわかる. 全ケースの平均では約9[%]のリーク電力削減を実現した.

BEP ミス率は、図 6 に示すように Dhrystone 実行時の SHIFT を除きすべてのケースで削減し、全体の平均で約 44[%] の改善を達成した.

提案方式によるパフォーマンスオーバヘッドは、およそ5.6[%] であった.

#### 5 おわりに

本稿では、コア温度情報を用いて OS が PG 実施方針を決定する制御方式を提案した。また提案方式について評価を行い、平均リーク電力の削減を確認した。

方法1との比較やスリープ頻度特性の判定方法を改良し更なる効果の向上を図ることは今後の課題である.

謝辞 本研究は、科学技術振興機構「JST」の戦略的創造研究推進事業「CRSET」における研究領域「情報システムの超低電力化を目指した技術革新と統合化技術」の研究課題「革新的電源制御による次世代超低電力高性能システム LSIの研究」によるものである.

#### 参考文献

- James Donald, Margaret Martonosi, "Power Efficiency for Variation-Tolerant Multicore Processors", International Symposium on Low Power Electronics and Design (Proc. ISLPED'06) SESSION10, No.3, pp.304-309, (Oct 2006).
- [2] Pratap Ramamurthy et al., "Performance-directed Energy Management using BOS", ACM SIGOPS Operating Systems Review, Vol.41, pp.66-77, (2007).
- [3] 中村宏, 天野英晴, 宇佐美公良, 並木美太郎, 今井雅, 近藤正章, 「革新的電源制御による超低消費電力高性能システム LSI の構想」, 情報処理学会研究報告 ARC-173, pp.79-84 (Jun 2007).
- [4] 関直臣 他「MIPS R3000 プロセッサにおける細粒度動的スリープ制御の実装と評価」,情報処理学会研究報告 2008-ARC-176, pp.71-76, (Jan 2008).
- [5] 砂田徹也 他「省電力 MIPS プロセッサにおける OS の試作と シミュレーションによる電力評価」,情報処理学会「システムソ フトウェアとオペレーティング・システム」第 108 回研究報告, Vol.2008-OS-108, pp.163-170 (Apr 2008)