問題本文
データマイニングとは,データベースに蓄積されている大量の生データに対し,統計やパターン認識などの手法を用いることによって,認識されていなかった規則性や関係性を導き出す技術である。データマイニングの応用分野として,最も適切なものはどれか。
選択肢
- ア.顧客に応じた商品の推薦
- イ.生産計画に基づく製造機械の割当て
- ウ.店舗別商品カテゴリ別の売上高の集計
- エ.累計購買金額による優良顧客の抽出
解説
データマイニング (data mining) は大量のデータを統計やパターン認識,機械学習等の手法で分析し,従来は気付かれなかった規則性や関係性を発見する技術である.「おむつとビール」のような関連購買発見が古典例として有名.単純な集計や条件検索とは異なり,新たな知識を「掘り出す (mine) 」点が本質.顧客レコメンド,市場バスケット分析,異常検知などが代表的な応用分野で,ビッグデータ時代の中核技術である.覚え方や類
選択肢ごとの解説
- ア.正解.購買履歴から顧客の嗜好パターンを発見し関連商品をレコメンドするのは,協調フィルタリングなどデータマイニングの典型応用例である.単純な集計では得られない関係性の発見が特徴で,ECサイトの「あなたへのおすすめ」が好例.
- イ.製造機械の割当ては生産スケジューリング (組合せ最適化) の問題で,線形計画やヒューリスティック手法を用いて解く.データマイニングではなくオペレーションズリサーチ (OR) の領域に属する.最適化と知識発見は別問題.
- ウ.売上高の集計は単純な集計処理 (SUM等) で行え,既知の項目を合算するだけの作業.データマイニングの本質である「未知の規則性発見」とは異なる作業で,通常の集計レポート作成に分類される.覚え方や類似用語の区別を
- エ.累計購買金額による顧客抽出はSQL等での条件抽出で済む処理.既知の指標による単純検索であり,データマイニングが扱う知識発見ではなくクエリ機能の範囲.条件抽出と知識発見の違いに注意.覚え方や類似用語の区別を整理し
ITパスポート 2009年 (平成21年 秋期) の過去問一覧へ戻る・問4