Kick Starterで目標額を達成するかどうかを左右するのはなにか?

今回は、Kick Starterで、目標額を達成するかしないかを左右する要因を分析していこうと思います。

達成額(pledged)の分布

まず、全データで、達成額(pledged)の分布を見てみました。直感どおりですが、金額が高くなるほど、件数が指数関数的に少なくなっているのが見て取れます。

Loading...

外れ値を除外してみても、同じ傾向が見て取れます。

Loading...

国別の目標額対達成額の散布図

どのような目標額を掲げたプロジェクトが、どのようた達成額を得ているのか、散布図で可視化しました。 国によって経済状況や傾向がちがうだろうと考えられるため、散布図は国別としました。

Loading...

やはり、まず本国アメリカでの件数が多いことが見て取れます。

アメリカでの目標額対達成額の散布図

分析の対象を、まずはアメリカに絞ろうと思います。status列で色分けして、プロジェクトの結果がどうなったのかも分かるようにします。

Loading...

pledgedが、goalを上回ると、successfulのstatusになっています。これはsuccessfulというstatusの定義がそういうことなのでしょう。このラインをギリギリうわまわるあたりと、全くこれにとどかないpledgedゼロの近辺に二極化していることがみてとれます。おそらくは、成功ラインに近くなったプロジェクトは、「あと少し!」という頑張りによって多くがsuccessfulのステータスを達成し、逆に、始めてみたものの少し経過を見て「これはダメだ。。。」というものは早い段階であきらめられてしまっているのではないかと想像できます。

ランダムフォレストによる、達成、非達成の予測

ランダムフォレストで、プロジェクトの目標達成か非達成かを予測するモデルをつくり、各予測変数の影響度を見てみます。

Loading...

やはりgoal(目標額)がどれほどなのかというのは達成確率に大きな影響を持つようです。 次に、どのような分野のプロジェクトなのかということも大きな影響があるようです。Tabletop Games、Shorts(短編映画)などが成功確率の高い分野のようです。逆にFictionやFashionは成功確率の点で不利な分野だと言えそうです。 ローンチされた年(lanuched_y)も大きな影響があり、これは成功しやすかった時、しにくかった時といったトレンドが存在することを示唆していると思われます。 その他のローンチタイミングに関する変数は影響度が小さくなってきますが、12月や、土曜日のローンチは避けたほうがいいのかもしれません。

上のモデルのチャートでは高額のプロジェクトが外れ値のようになって、目標額の影響の傾向の詳細がよくわからないため、$0.1M以下の目標額のプロジェクトのみにしぼってモデルを作成してみました。

Loading...

比較的低目標額のプロジェクトにしぼっても、やはりプロジェクトが高額になるほど達成のハードルは高くなっていることが見て取れます。その他の要因についてもほぼ同じ傾向がそのまま見られるようです。