基本情報技術者試験 過去問解説
ビッグデータとは?基本情報技術者試験 令和6年度 科目A 問15を解説
基本情報技術者試験 令和6年度 科目A 問15は、ビッグデータに関する理解を問う問題です。検索から入っても、問題文、選択肢、正解、解説、各選択肢がなぜ違うかをこのページだけで確認できます。
問題文
ビッグデータ分析の前段階として,非構造化データを構造化データに加工する処理を記述している事例はどれか。
この問題の出題ポイント
- ビッグデータの定義だけでなく、問題文中の条件がどの選択肢に当てはまるかを確認する。
- データベース分野では、用語の目的・主体・責任範囲の違いが選択肢で問われやすい。
- 関連タグ: ビッグデータ、個人情報保護、不正アクセス対策。
選択肢
- ア関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し,利用者が扱いやすい表計算ソフトウェアデータに加工する。
- イ個人情報を含むビッグデータを更に利活用するために,特定の個人を識別することができないように匿名化加工する。
- ウ住所データ項目の中にある,"ヶ"と"が"の混在や,丁番地の表記不統一を,標準化された表記へ統一するために加工する。
- エソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。正解
正解
エ: ソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。
解説
非構造化データ(自由テキスト等)を構造化(表形式・関係DB形式)に加工する例は、SNS の口コミを機械学習で単語分解・要約して関係 DB に格納するエが該当します。エが正解。
なぜ他の選択肢が違うのか
ア
関係 DB のデータを表計算データに変換するのは構造化→構造化で、非構造化からの加工ではありません。
イ
匿名化加工はプライバシー保護で、構造化加工ではありません。
ウ
住所表記の統一はデータクレンジングで、構造化→構造化の正規化処理です。
エ(正解)
自然文の口コミを機械学習で構造化データに変換する、非構造→構造の典型例で正解です。
解き方の整理
ビッグデータの問題では、選択肢のキーワードだけで判断せず、問題文が示す条件と正解選択肢の説明が一致しているかを見ます。誤答選択肢は、似た用語を混ぜる、主体を入れ替える、目的や範囲を広げすぎる、という形で作られることが多いため、選択肢別解説まで確認しておくと復習効率が上がります。
関連用語
関連問題
前後の問題
令和6年度 科目A の関連する問題
復習を続ける
間違えた問題、苦手タグ、模試履歴を保存して復習する導線を用意しています。広告なしPro、弱点分析、復習リマインダーは段階的に提供予定です。