問題本文
経営判断や業務遂行などに活用するために,データベースに蓄積された顧客の購買履歴などのデータを分析して,有用な情報を抽出する手法はどれか。
選択肢
- ア.データクレンジング
- イ.データマイニング
- ウ.データマネージング
- エ.データモデリング
解説
正解はイ.データマイニング(Data Mining)は大量に蓄積された顧客の購買履歴やログから統計分析・機械学習・相関ルール抽出などを用いて隠れたパターンや有用な知識を発見する手法.「マーケットバスケット分析」(同時購買の傾向把握)が代表例で,スーパーのPOSデータ分析やECサイトのレコメンドで活用される.データクレンジングは表記揺れや欠損などのデータ品質修正(前処理),データモデリングはDBの実体関連設計(ERモデル),「データマネージング」は明確な分析手法名ではなく,いずれも分析による知識抽出を直接指す用語ではない.
選択肢ごとの解説
- ア.データクレンジングは重複・表記揺れ・欠損・誤入力など汚れたデータを正規の形に整える前処理工程.分析の前段に行うデータ品質向上作業であり,データ自体から有用なパターンを発見するための分析手法ではない.分析の準備段階の作業として位置付けられ知識発見ではない.
- イ.正解.データマイニングは蓄積データから統計手法や機械学習で相関・分類・クラスタリング・関連ルール等のパターンを抽出する手法.顧客購買データから「Aを買う人はBも買う」などの知見を引き出し経営判断やマーケティング(レコメンド等)に活かす.ビッグデータ活用の中核技法.
- ウ.「データマネージング」は明確に定義された分析手法名ではなく,データ管理一般を漠然と指す表現に近い.データから知識を抽出する分析手法ではないため設問の答えにはならない.選択肢として紛らわしいが正式な分析手法名ではない点に注意するべき.対象や目的が設問の条件と異なるため不適切.
- エ.データモデリングはデータベースの構造(エンティティ・属性・関連)を設計する作業で,E-R図などで実体関連を表現する.データベース構築の準備段階の設計作業であり,分析による知識発見の手法ではない.データの「使い方」分析ではなく「持ち方」の設計が役割..
ITパスポート 2012年 (平成24年 秋期) の過去問一覧へ戻る・問5