日本の統計データ(e-Stat)を使用して、犯罪数の傾向を見てみたいと思います。
e-Statのサイトからエクセルファイルをダウンロードします。
URLはこちらです。
ダウンロードしたのは平成21年(2009年)から平成30年(2018年)までの10年間としました。
エクセルファイルを開いてみます。 シートがたくさんあってめまいがしそうになります。シート「第1表」は犯罪の全体の集計をまとめているようですので、今回はこちらのシートを集計してみたいと思います。ちなみに他のシートは各罪種について都道府県毎にブレークダウンしたもののようです。
エクセルの行列名が表示されておらずみづらいため、表示します。エクセルのオプションの「行列番号を表示する」にチェックを入れると表示することができます。
各ファイル共にフォーマットは同じでした。ファイルを読み込んだ後、ファイル名を変えて同様の手順で読み込みたいと思います。そのため、ファイル名を少し変更しました。ちなみにファイルの拡張子はもともと「.xls」でした。
シート「第1表」を見てみます。左の列から「罪種」が大分類、中分類、小分類、のようにブレークダウンされてディメンションがならんでおります。次にメジャーとして認知件数や検挙件数などの項目が並んでいます。中分類を合計しても大分類の数と一致しない箇所が多々ありました。そのため、大分類、中分類、小分類、それぞれ別々にデータフレームを作成しそれぞれに対応したディメンションとメジャーに分けたいと思います。
試しに平成30年度のファイルを読み込み込んでみます。最初の8行をスキップし、必要な列を選択して読み込みます。注意点として、先に行をスキップして「実行」ボタンを押してから最後に列を選択してください。先に列を選択すると行をスキップしたときにチェックボックスがずれる場合があります。
平成30年度のフィアルを読み込んだ後、右のメニューから「Rスクリプトを生成」を選び、Rスクリプトをコピーします。次に「データフレーム」メニューから「Rスクリプト」を選びさきほどコピーしたスクリプトを貼り付けます。ファイル名のところを別のファイルに書き換えてください。
同様にRスクリプトのコピペで全ファイルを読み込みます。
作成した10個のデータフレームをマージします。年度の列を作成するため、「データフレーム名を保持する」にチェクをいれます。
「ブランチの作成」で罪種の分類毎にデータフレームを作成します。「フィルタ」と「列を選択」で必要な行と列のみにします。
チャートで刑法犯総数の傾向を見てみます。
「認知件数」「検挙数」「検挙人数」「少年」いずれも減少傾向です。
検挙率は上昇傾向です。30%から40%くらいまで上がっています。
他と比較して窃盗犯が多いです。
「略取誘拐・人身売買」が上昇傾向なのが目に付きます。
なんと検挙率が100%を超えているものがあります。不思議なグラフです。冤罪でしょうか。数字を見るとシンプルに検挙件数を認知件数で割った値のようです。事案ごとの対応を考慮していないのであれば、年度がずれたりすると100%を超えることもありえそうです。 ちなみに余談ですが、検挙、逮捕、起訴されても裁判で有罪判決が確定するまでは無罪と推定されます。
全体的に犯罪は減少傾向なことがわかりました。