こんな感じで、同じ構造でトレンドを持つランダムレートを2列ずつ生成しまくる。
片方を説明変数、もう片方を被説明変数として、決定係数を求める。
これを100回計測してみた。
こうなった。
平均 |
0.223446 |
最大 |
0.692937 |
最小 |
0.000231 |
偶然にも、大きな決定係数が観測されることがあり得る。
対して、トレンドを持たないランダムレートの場合は、
(こういう2系列×100パターン)
平均 |
0.008859073 |
最大 |
0.051156799 |
最小 |
0.00000128 |
こうなる。
新たな謎が出てきてしまったw
なんかの本に載ってて、突然気になったので試してみた。
今わかることは、
トレンドを持った時系列データを回帰分析に用いる場合は注意が必要ですよっと。
[2回]
PR