【NBA】最も重要なプレイヤースタッツ

はじめに

  • この分析にあたり使用したデータはNBA Boxscoreという試合におけるプレイヤーのスタッツを記録したシート
  • 2010-11シーズンから2021-22シーズンまでのゲームデータを使用

参考Boxscore

  1. Boxscoreに各対戦チームの勝者敗者をWinというカラム(Win:1orLose:0)を追加 ※別途Pythonにて自作
  2. Winを目的変数として他主要数値データを説明変数に各モデルで学習
  3. レポート

分析

XGBoostによる勝敗予測モデル - 変数重要度

  • 最も重要な変数は「+/-」で、FGAやPTSが続く
Loading...

ランダムフォレストによる勝敗予測モデル - 変数重要度

  • 最も重要な変数は「+/-」で、FGAやPTSなどが続く
  • 興味深いのは、アテンプト(FGA,2PA,3PA)の方がメイド=成功(FG,2P,3P)のカラムより比較的高順位に位置していること
Loading...

決定木による勝敗予測モデル - 変数重要度

  • 最も重要な変数は「+/-」で、続いてFGAのみが変数として意味をなしている(他変数は無となっている)
  • 決定木というシンプルなアルゴリズムであるが故と推測される
Loading...

決定木による勝敗予測モデル - ツリーマップ

  • 非常にシンプルなツリーマップ
  • +/-が11以上の選手は勝利確率が90%(頻度としては16%)となっている。真逆の枝は、+/-が−5.5以下でFGAが5.5以上、大雑把に言うとFGAが多いにも関わらず+/-では+(=得点)に繋がっていない傾向があると敗戦確率が高くなるということであろう。実際の試合感覚とそれなりにイメージが重なるところである ※ツリーマップの読み解き方は上記で合っているかわからない
Loading...

まとめ

NBAで最も重要なプレイヤースタッツは「+/-」であった。「+/-」はいわゆる得失点差のことであり、プレイヤーが出場している時間帯に発生した得点と失点をプラス、マイナスした数値である。1996-97シーズン以降に導入された

競技としてのプロバスケットボールは、非常にシンプルに制限時間に相手より得点したチームの勝ちであり、「+/-」というスタッツは明らかに関連性が高いであろうと分析前から感じていた。

次回は得点と直接関係のあるスタッツを除いた分析をしてみたい

Export Chart Image
Output Format
PNG SVG
Background
Set background transparent
Size
Width (Pixel)
Height (Pixel)
Pixel Ratio