詳しくは勉強会の口頭で補足します。
2 個の時系列データの相関を考えるときは…にある、見せかけの相関の例をExploratoryでやってみる。
x
とy
はいかにも関係ありそう。
x
とy
の相関も高い。
散布図x ~ t
を見る。
散布図y ~ t
を見る。
x ~ t
の回帰分析を行い、t
で説明できない部分であるresid_x
と、y ~ t
の回帰分析を行い、t
で説明できない部分であるresid_y
を算出する。
その後に、resid_y ~ resid_x
の散布図を書くとこうなる。つまり、t
がx
とy
に影響を与えていて、x
とy
が関係しているように見えた。
なので、t
を統制変数(今もこう呼ぶのかな?)として、y ~ x + t
で重回帰分析すると、x
は関係ないことがわかる。
ちなみに、この場合のx
の偏相関係数は、resid_y ~ resid_x
の回帰係数と一致する。一致するというよりも、そうやって計算しているのが、偏相関係数という方が正しいか。