基本情報技術者試験 過去問解説

ビッグデータとは?基本情報技術者試験 令和6年度 科目A 問15を解説

基本情報技術者試験 令和6年度 科目A 問15は、ビッグデータに関する理解を問う問題です。検索から入っても、問題文、選択肢、正解、解説、各選択肢がなぜ違うかをこのページだけで確認できます。

問題文

ビッグデータ分析の前段階として,非構造化データを構造化データに加工する処理を記述している事例はどれか。

この問題の出題ポイント

  • ビッグデータの定義だけでなく、問題文中の条件がどの選択肢に当てはまるかを確認する。
  • データベース分野では、用語の目的・主体・責任範囲の違いが選択肢で問われやすい。
  • 関連タグ: ビッグデータ、個人情報保護、不正アクセス対策。

選択肢

  1. 関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し,利用者が扱いやすい表計算ソフトウェアデータに加工する。
  2. 個人情報を含むビッグデータを更に利活用するために,特定の個人を識別することができないように匿名化加工する。
  3. 住所データ項目の中にある,"ヶ"と"が"の混在や,丁番地の表記不統一を,標準化された表記へ統一するために加工する。
  4. ソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。正解

正解

: ソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。

解説

非構造化データ(自由テキスト等)を構造化(表形式・関係DB形式)に加工する例は、SNS の口コミを機械学習で単語分解・要約して関係 DB に格納するエが該当します。エが正解。

なぜ他の選択肢が違うのか

  • 関係 DB のデータを表計算データに変換するのは構造化→構造化で、非構造化からの加工ではありません。

  • 匿名化加工はプライバシー保護で、構造化加工ではありません。

  • 住所表記の統一はデータクレンジングで、構造化→構造化の正規化処理です。

  • エ(正解)

    自然文の口コミを機械学習で構造化データに変換する、非構造→構造の典型例で正解です。

解き方の整理

ビッグデータの問題では、選択肢のキーワードだけで判断せず、問題文が示す条件と正解選択肢の説明が一致しているかを見ます。誤答選択肢は、似た用語を混ぜる、主体を入れ替える、目的や範囲を広げすぎる、という形で作られることが多いため、選択肢別解説まで確認しておくと復習効率が上がります。

関連用語

関連問題

前後の問題

令和6年度 科目A の関連する問題

復習を続ける

間違えた問題、苦手タグ、模試履歴を保存して復習する導線を用意しています。広告なしPro、弱点分析、復習リマインダーは段階的に提供予定です。