問題本文
蓄積された販売データなどから,天候と売れ筋商品の関連性などの規則性を見つけ出す手法を表す用語はどれか。
選択肢
- ア.データウェアハウス
- イ.データプロセッシング
- ウ.データマイニング
- エ.データモデリング
解説
データマイニング(Data Mining)は,蓄積された大量のデータから,統計解析・機械学習・パターン認識・クラスタリング・アソシエーション分析などの手法を用いて,人間が気付かなかった規則性・相関関係・隠れた知見を発見する技術である. 「天候と売れ筋商品の相関」「商品Aを買う人は商品Bも買う傾向」「曜日と購買行動の関連」など,業務改善や売上向上に役立つ知見を蓄積データから抽出する. ビッグデータ・AI時代の中核技術として広く活用されている. データウェアハウスは分析用データを集約蓄積する基盤,データプロセッシングは一般的データ処理,データモデリングはDB構造設計で,いずれも規則性発見そのものとは目的・役割が異なる用語である.
選択肢ごとの解説
- ア.誤り. データウェアハウスは複数の業務システムから収集したデータを分析目的で時系列・主題別に統合蓄積するデータベース基盤の説明で,規則性を発見する分析手法そのものではない. データマイニングの実施基盤(分析の前提となる蓄積環境)を提供する役割を担うインフラに位置付けられる.
- イ.誤り. データプロセッシングは一般的なデータ処理全般を指す広義の用語で,規則性発見に特化した手法ではない. 入力・加工・集計・出力などコンピュータでデータを処理する作業全般を総称する一般的な用語で,データマイニングのような特定の分析技術を指す用語ではない別の概念である.
- ウ.正しい. データマイニングは蓄積された販売データなどから天候と売れ筋商品の関連性などの規則性を統計解析や機械学習等を用いて発見する手法であり,本問の用途に合致するため. ビッグデータ活用の中核技術として小売・金融・医療など多くの分野で実用化されている代表的な分析技術である.
- エ.誤り. データモデリングはデータベース設計のためにエンティティ・属性・関係を定義し,概念データモデル・論理データモデル・物理データモデルを作成する上流設計手法の説明である. データ構造をどう作るかの設計作業を扱うもので,規則性を見出すデータ分析作業とは作業内容が大きく異なる.
ITパスポート 2016年 (平成28年 秋期) の過去問一覧へ戻る・問27