離職ランダムフォレスト
0.96463464296
0.50773993808
0.89183673469
0.10816326531
0.95348837209
0.34599156118
237
1,233
1,470
表から分かるように、AUCが0.96と非常に高い値を示しており、モデルの性能が優れていることを示唆しています。また、正解率も0.89と高く、予測の精度が高いモデルであると言えます。ただし、F1スコアは0.50と低めで、再現率が低いため、誤分類率やクラスの偏りの影響を受けている可能性があります。
離職のXGBoost
0.98398130182
0.78371501272
0.94217687075
0.057823129252
0.98717948718
0.64978902954
237
1,233
1,470
ランダムフォレストと比べてXGBoostでは、XGBoostの方が予測精度が高かった。またランダムフォレストでは、部署や有給取得の重要度が高い位置にあるが、XGBoostでは、総労働時間が比較的重要な変数になっていた。
AUCはこのモデルに使われている予測変数が目的変数のTRUEとFALSEのデータをどれだけうまく切り分けることができるかを示します。
AUCの値は基本的に0.5から1の間です。1は予測が全て正解であることを意味し、逆に0.5はモデルによる予測がランダムな推測と同等であり、つまり予測精度が最も悪いことを意味します。
F1 スコアはモデルによる予測結果がどれだけ、トレードオフ関係にある
適合率(Precision)と
再現率(Recall)の両方をバランス良く満たすことができているかを示します。
F1 スコアは適合率と再現率の2つの値を
調和平均したものです。
値は0から1の間で、1に近づくほど予測精度が良く、適合率と再現率がバランス良く同時に高いことを意味します。
正解率はどれだけ予測値と実測値が一致しているかを示します。
全ての予測結果のうち、実測値と比べて正しくTRUEもしくはFALSEと予測されたデータの割合です。
0から1の範囲の値で、1に近づくほど良いと言えます。
誤分類率は全ての予測結果のうち、予測値と実測値が一致していない割合です。
0から1の範囲の値で、1は全ての予測結果が間違っていることを示します。
適合率(Precision)モデルがTRUEと予測した場合に正解である確率です。
モデルがTRUEと予測したうち、実測値もTRUEだった割合として計算されます。つまり、どれくらい正解に「適合」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
再現率(Recall)は実測値がTRUEのデータに対して、予測モデルもTRUEとして正しく予測できる確率です。
つまり、どれくらい正解を「再現」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
感度(Sensitivity)、真陽性率(True Positive Rate)と呼ばれることもあります。
AUCはこのモデルに使われている予測変数が目的変数のTRUEとFALSEのデータをどれだけうまく切り分けることができるかを示します。
AUCの値は基本的に0.5から1の間です。1は予測が全て正解であることを意味し、逆に0.5はモデルによる予測がランダムな推測と同等であり、つまり予測精度が最も悪いことを意味します。
F1 スコアはモデルによる予測結果がどれだけ、トレードオフ関係にある
適合率(Precision)と
再現率(Recall)の両方をバランス良く満たすことができているかを示します。
F1 スコアは適合率と再現率の2つの値を
調和平均したものです。
値は0から1の間で、1に近づくほど予測精度が良く、適合率と再現率がバランス良く同時に高いことを意味します。
正解率はどれだけ予測値と実測値が一致しているかを示します。
全ての予測結果のうち、実測値と比べて正しくTRUEもしくはFALSEと予測されたデータの割合です。
0から1の範囲の値で、1に近づくほど良いと言えます。
誤分類率は全ての予測結果のうち、予測値と実測値が一致していない割合です。
0から1の範囲の値で、1は全ての予測結果が間違っていることを示します。
適合率(Precision)モデルがTRUEと予測した場合に正解である確率です。
モデルがTRUEと予測したうち、実測値もTRUEだった割合として計算されます。つまり、どれくらい正解に「適合」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
再現率(Recall)は実測値がTRUEのデータに対して、予測モデルもTRUEとして正しく予測できる確率です。
つまり、どれくらい正解を「再現」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
感度(Sensitivity)、真陽性率(True Positive Rate)と呼ばれることもあります。
AUCはこのモデルに使われている予測変数が目的変数のTRUEとFALSEのデータをどれだけうまく切り分けることができるかを示します。
AUCの値は基本的に0.5から1の間です。1は予測が全て正解であることを意味し、逆に0.5はモデルによる予測がランダムな推測と同等であり、つまり予測精度が最も悪いことを意味します。
F1 スコアはモデルによる予測結果がどれだけ、トレードオフ関係にある
適合率(Precision)と
再現率(Recall)の両方をバランス良く満たすことができているかを示します。
F1 スコアは適合率と再現率の2つの値を
調和平均したものです。
値は0から1の間で、1に近づくほど予測精度が良く、適合率と再現率がバランス良く同時に高いことを意味します。
正解率はどれだけ予測値と実測値が一致しているかを示します。
全ての予測結果のうち、実測値と比べて正しくTRUEもしくはFALSEと予測されたデータの割合です。
0から1の範囲の値で、1に近づくほど良いと言えます。
誤分類率は全ての予測結果のうち、予測値と実測値が一致していない割合です。
0から1の範囲の値で、1は全ての予測結果が間違っていることを示します。
適合率(Precision)モデルがTRUEと予測した場合に正解である確率です。
モデルがTRUEと予測したうち、実測値もTRUEだった割合として計算されます。つまり、どれくらい正解に「適合」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
再現率(Recall)は実測値がTRUEのデータに対して、予測モデルもTRUEとして正しく予測できる確率です。
つまり、どれくらい正解を「再現」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
感度(Sensitivity)、真陽性率(True Positive Rate)と呼ばれることもあります。
AUCはこのモデルに使われている予測変数が目的変数のTRUEとFALSEのデータをどれだけうまく切り分けることができるかを示します。
AUCの値は基本的に0.5から1の間です。1は予測が全て正解であることを意味し、逆に0.5はモデルによる予測がランダムな推測と同等であり、つまり予測精度が最も悪いことを意味します。
F1 スコアはモデルによる予測結果がどれだけ、トレードオフ関係にある
適合率(Precision)と
再現率(Recall)の両方をバランス良く満たすことができているかを示します。
F1 スコアは適合率と再現率の2つの値を
調和平均したものです。
値は0から1の間で、1に近づくほど予測精度が良く、適合率と再現率がバランス良く同時に高いことを意味します。
正解率はどれだけ予測値と実測値が一致しているかを示します。
全ての予測結果のうち、実測値と比べて正しくTRUEもしくはFALSEと予測されたデータの割合です。
0から1の範囲の値で、1に近づくほど良いと言えます。
誤分類率は全ての予測結果のうち、予測値と実測値が一致していない割合です。
0から1の範囲の値で、1は全ての予測結果が間違っていることを示します。
適合率(Precision)モデルがTRUEと予測した場合に正解である確率です。
モデルがTRUEと予測したうち、実測値もTRUEだった割合として計算されます。つまり、どれくらい正解に「適合」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
再現率(Recall)は実測値がTRUEのデータに対して、予測モデルもTRUEとして正しく予測できる確率です。
つまり、どれくらい正解を「再現」できたのかを測る指標と言えます。
0から1の範囲の値で、1に近づくほど良いと言えます。
感度(Sensitivity)、真陽性率(True Positive Rate)と呼ばれることもあります。