class: center, middle # ユーザーに反応されやすい動画の特徴は何か? --- # 目的 単純な興味から、どういった動画のカテゴリーが評価やコメントがつけられやすいのか気になったので、反応されやすい動画はどういった動画なのかを分析していきます。 --- # 分析前の下準備 今回は日本のデータを対象に分析していく。 そして、このデータには下記の数値型の列がある。 * views (ビュー数) * likes (高評価数) * dislikes (低評価数) * comment_count (コメント数) --- 今回の目的であるユーザーに反応されやすい動画を調べるために、下記の列を作成した。 ``` 評価率 = (likes + dislikes) / views * 100 ``` ``` コメント率 = comment_count / views * 100 ``` ``` 高評価率 = likes / (likes + dislikes) * 100 ``` --- ちなみに、評価やコメントが無効化されている動画もあるためフィルタを使って事前に評価ができる動画のみにしている。  --- ### 評価率の分布 評価率の平均は2%と100回再生されたら、平均して2回は高評価または低評価が押されている。
Loading...
--- ### コメント率の分布 コメントは敷居が高いようだ。高評価と似たような分布となっているが、平均値は0.36%と1000回再生されたら平均して3.6回コメントされる。
Loading...
--- ### 高評価率の分布 高評価率の平均は88%と一般的に高評価の方が多くなるようだ。
Loading...
--- ### カテゴリーごとの評価率の95%信頼区間 MusicやPets&Animalsといったカテゴリーは評価ボタンが押されやすい。逆にSportsやNews&Politicsは評価ボタンをクリックされにくいようだ。
Loading...
--- ### カテゴリーごとのコメント率の95%信頼区間 またしてもMusicの場合は他のカテゴリーに比べてコメントがされやすい。
Loading...
--- ### カテゴリーごとの高評価率の95%信頼区間 高評価率で見てみてもMusicやPets&Animalsは96%が高評価とかなり割合が高い。News&Politicsはニュースへの批判が多くなりそうだから高評価率が低いのだろうか。
Loading...
--- class: center, middle # 結局どのカテゴリーが反応がいいの? --- ## K-meansクラスタリング 使用した変数 * 評価率 * コメント率 * 高評価率 比較対象の列 * カテゴリー --- ### K-means: 散布図 Cluster3が評価率とコメント率が高い動画が集まっているようだ。
Loading...
--- ### K-means: 箱ヒゲ図
Loading...
--- ### K-means: 箱ヒゲ図 Cluster1: 反応しづらい動画。 Cluster2: いたって普通の動画 Cluster3: 超反応率が良い動画! --- ### K-means: スタックバーチャート Cluster3にはMusicやPets&Animalsの割合が高くなっている!
Loading...
--- ### 行の数におけるClusterの割合
Loading...
--- ### Cluster3の動画の割合 やっぱり反応されやすい動画はMusicとPets&Animalsのようだ。
Loading...
--- # 得られたインサイト * コメントは評価に比べて敷居が高い。 * 音楽は圧倒的に反応がいい。 * ペットや動物の動画は評価率も高く高評価になりやすい。 * ニュースや政治系は他のカテゴリーに比べて高評価率は低い。 --- # 全体を通してのコメント どういったテーマにすれば良いか、どういった質問をしていけばいいかが難しい! ただ、評価率のように新しい列を作成して分析を進められたのはよかったかも。