理系学生日記

おまえはいつまで学生気分なのか

伸び率に対する平均は算術平均ではなく幾何平均を使うべき

指数化

ある時点$t$における値$y_t$と、次の時点$t+1$における値$y_{t+1}$を比較することは多く行われます。例えばMAUが前年度に対してどれだけ伸びた、四半期の売り上げがどれだけ伸びた、というようなケースですね。

こういったときの比較として、単純な差$y_{t+1} - y_{t}$ではなく、変化率$\frac{y_{t+1} - y_{t}}{y_{t}}$を見ることも、やはり多く行われます。これはある時点を基準化した値(この例では、$y_{t}$が基準ですね)であり、このような基準に対する値にすることを「指数化」と呼びます。

観測値が$y=(y_0,y_1,y_2,\cdots , y_{T-1}, y_{T})$であり、基準時$s$のときの値を$y_{s}$とすると、各時点$t$のときの指数$q_{t}$は$q_{t}=\frac{y_{t}}{y_{s}}$になります。

伸び率に対する平均には幾何平均を使う

ここで、前期比データが$r_{t}=\frac{y_{t}}{y_{t-1}}$ $(t=1, 2, \cdots, T)$で与えられた時を考えます。

このとき期間$T$における伸び率は以下のように表せるでしょう。

$$ \frac{y_{T}}{y_{0}}=\left(\frac{y_{1}}{y_{0}} \right) \left(\frac{y_{2}}{y_{1}} \right) \left(\frac{y_{3}}{y_{2}} \right)\cdots \left(\frac{y_{T}}{y_{T-1}} \right)=r_{1}r_{2}r_{3}\cdots r_{T}= \prod_{t=1} ^{T} r_{t} $$

従って、期間$T$を構成するそれぞれの期における伸び率$r_{t}$の平均$r_{G}$は以下の式になり、これを伸び率$r_{t}$の幾何平均と呼びます。

$$ r_{G} = \left( \prod_{t=1} ^{T} r_{t} \right) ^{\frac{1}{T}} $$

よく知られた算術平均$\frac{\sum_{t=1} ^{T} r_{t}}{T}$でないのは、今回対象としている伸び率が「乗算」によって定義される値であるのがポイントでしょう。このような伸び率を算術平均で平均してしまうと、適切な値が得られず、本来の平均よりも大きな値になってしまいます。

これは、算術平均と幾何平均の間に以下のような関係式が成立するためです。これは、よく知られた相加相乗平均の不等式を一般化したものですね。

$$ \frac{\sum_{i=1} ^{N} a_{i}}{N} \geq \left( \prod_{i=1} ^{N} a_{i} \right) ^{\frac{1}{N}} $$