見せかけの相関(擬似相関;spurious correlation)

詳しくは勉強会の口頭で補足します。

2 個の時系列データの相関を考えるときは…にある、見せかけの相関の例をExploratoryでやってみる。

xyはいかにも関係ありそう。

Loading...

xyの相関も高い。

Loading...

散布図x ~ tを見る。

Loading...

散布図y ~ tを見る。

Loading...

x ~ tの回帰分析を行い、tで説明できない部分であるresid_xと、y ~ tの回帰分析を行い、tで説明できない部分であるresid_yを算出する。

その後に、resid_y ~ resid_xの散布図を書くとこうなる。つまり、txyに影響を与えていて、xyが関係しているように見えた。

Loading...

なので、tを統制変数(今もこう呼ぶのかな?)として、y ~ x + tで重回帰分析すると、xは関係ないことがわかる。

Loading...

ちなみに、この場合のxの偏相関係数は、resid_y ~ resid_xの回帰係数と一致する。一致するというよりも、そうやって計算しているのが、偏相関係数という方が正しいか。