例えば以下のようにPDFの中に表があり、そのテキストのコピーが可能なときには、「テキスト・インプット」を利用して簡単にデータのインポートが可能です。
そこで、このノートでは、そちらのやり方を紹介いたします。
まず、PDFの表内のテキストを選択して、該当のテキストをコピーします。
続いて、Exploratoryデスクトップに移動して、データフレームの横の+(プラス)ボタンをクリックして、「テキスト・インプット」をクリックします。
すると、「テキスト・インプットデータをインポート」するためのダイアログが表示されるので、テキスト・インプット・エディタにコピーしたテキストを貼り付けて、実行します。
実行ボタンをクリックすると、以下のようにプレビューが表示されます。
なお重複する列名があると、Exploratoryでは同じ列名のデータをそのままインポートすることができないので、列名の後に「...列番号」といった接尾文字が自動で付与されます。
また、期待している列名や値が表示されないときには、直接、列名や値を編集することが可能です。
データの編集を終えたら、「保存」ボタンをクリックして、任意のデータをフレームを設定し、「作成」ボタンをクリックしてデータのインポートが可能です。
これでデータインポートのは完了です。
なお、今回インポートしたデータは、Year(年)、Apprehensions(違法移民の数)が2回繰り返されてしまっており、インポートしたデータのままでは、集計や可視化をするときに不便ということもあります。
そういったときには、インポートしたデータにステップを追加してデータを加工することで集計や可視化に適したデータに変換することが可能です。
今回のデータを使って、集計や可視化に適したデータに変換する方法の詳細はこちらの動画で詳細を紹介していますので、よろしければ、ご参考ください。