ここで言うN増しとは年次から月次、日次へ分割してサンプル数を増やすことを意味します(単純に時間を長く取ることで統計が上がるのは自明)。"統計"とは精度や確度を指します。
以下は以前「
リターンとリスクの時間換算」で用いた日経平均の28年分のデータから、年次か月次か日次かで騰落率のヒストグラムをとったものです。当然ながら細かくなるほどヒストを構成するNは多くなります。
【年次】
【月次】
【日次】
年はヒストの体を成していないのに対して月、日ほどそれらしい分布に近づいていき、細かくすればするほど精度が上がっているように見えます。
よって、周期のより短いデータがあるなら、それを長周期に換算する方が統計が上がると考えられます。
次に、年次から月次、日次へのN増しによる標準誤差への影響を考えます。
年率σをσyとすると、n年間の標準誤差は
σy/√n ・・・(i)
σy=σm×√12より、
σy/√n=(σm×√12)/√n=12*(σm/√(12n)) ・・・(ii)
一方、月率σをσmとすると、n年間(=12n月)の標準誤差は
σm/√(12n) ・・・(iii)
σm=σy/√12より、
σm/√(12n)=(σy/√12)/√(12n)=(1/12)*(σy√n) ・・・(iv)
(i)と(iv)あるいは(ii)と(iii)を見ると月次で計算する方が標準誤差を12倍小さくできるように見えます。
年:(1+σy/√n)^n≒1+n*σy/√n+n(n-1)/2*(σy/√n)^2=1+√n*σy+(n-1)/2*σy^2
月:(1+σm/√(12n))^(12n)≒1+12n*σm/√(12n)+12n(12n-1)/2*(σm/√(12n))^2=1+√n*σy+(n-1/12)/2*σy^2
(テイラー展開により2次まで展開)
月次は12倍の乗算が必要なので、結局のところn年後のリスクはほぼ同等になります。ただし2次以降の寄与でわずかですが月次の方が大きくなるようです。これはおそらく複利の極限と同じで、分割数が増えるほどエクスポネンシャルに近づくためではないかと考えられます。つまり、
月:lim(1+σm/√(12n))^(12n)=lim(1+σy/(12√n))^(12n)=lim(1+σy/(d√n))^(dn)
σy/(d√n)=kと置くと、d→∞のときk→0であるから、
lim((1+k)^(1/k))^(σy√n)=e^(σy√n) (∵自然対数の底の定義より)
これらのことをsimで確認しておきます。
月次を基準に考えます。平均ゼロ、σm=6%の正規分布乱数により1200個(100年)の月次騰落率を生成し、所定の期間(12n月)分の移動平均を取り、その標準偏差をプロットします。年次騰落率は連続する12個の月次騰落率の組の幾何平均^12で算出し(1188個)、所定の期間(n年)分の移動平均の標準偏差を取ります。
【正規分布乱数】
【標準誤差と期待値のバラツキの推移】
横軸に期間n、左軸にσy、σmの標準誤差、右軸にn年後の期待値のバラツキを取っています。
年次、月次とも乱数によるsimと計算がほぼ一致しています。nに対して両対数で傾き-1/2であることから(i)と(iii)が、年次と月次の差が約12倍であることから(ii)と(iv)が、それぞれ成り立っていることがわかります。また右軸のn年後のリスクも年次と月次でほぼ同等で、e^(σy√n)に近い値であることが確認できます(月次がより大きくエクスポネンシャルに近いことはこの精度ではわかりません)。
(なお、年率σであるσyを12n月で標準誤差を取るようなN増し操作(σy/√(12n))は、上の年次の結果が示すように成り立たない(σy/√nと同じ)ことが確認できます。)
今回の統計が上がるかの論点は、
①Nを増やすとヒストの形状からして精度が上がりそう
②Nを増やすと標準誤差も小さくなるように見えるが、n年後の期待値のバラツキはほぼ変わらない(Nを増やすほどエクスポネンシャルの極限に近づく)
どちらかというと①は大数の法則からの要請、②は誤差伝搬法則や中心極限定理からの要請な気がします。
また、そもそもの前提として、ある期間のσを時間換算して算出する際には、対象がより細かい単位に"独立性やランダム性をもって"細分化されることが必要です。
(関連記事)