このノートでは、一意な行を残す方法を紹介いたします。
例えば、1行が1人の従業員のアンケートの回答を表す以下のように従業員のアンケートデータがあったとします。
このとき、1行目と2行目に注目すると、重複した回答がデータがあることがわかります。
このようなデータから、重複する行を取り除き、一意な行のみを残すには、ステップメニューの「これだけを残す/削除する...」から「一意な行」を選択します。
すると、重複する行を除くダイアログが表示されます。
評価の対象となる列では、「全ての列」にチェックを付けて、全ての列の値が一致する重複行を取り除くか、あるいは「指定した列」にチェックをつけて、指定した列の値のみが一致する重複行を取り除き、最初の重複行を残すかを指定することができます。
今回は、全ての列の値が一致する重複行を取り除きたいので、「全ての列」にチェックを付けます。
すると、以下のように、全ての列の値が一致する重複行を取り除かれます。
なお、指定した列を選択したときには、「選択...」のプルダウンメニューから重複行を取り除くときに参照する列を指定するプルダウンメニューが表示されます。
仮に、何らかの理由で従業員IDに誤った情報が入っている可能性を考慮して、それ以外の列の値が全て一致する重複行を取り除きたいときには、「従業員ID」以外の列にチェックを付けるわけです。
列の指定以外には、「他の列を残す」というオプションがサポートされています。
他の列に「TRUE」を選択したときには、全ての列が保持され、「FALSE」を指定したときには、指定しなかった列が結果から取り除かれます。
仮に今回のデータで「FALSE」を選んで実行すると、指定した列に指定しなかった、「従業員ID」の列元の列から取り除かれて、「従業員ID」以外の列の全ての値が一致する重複行が取り除かれます。
このとき、残される行は、先に出てくる行になります。