選択肢
- ア.関係データベースに蓄積された大量の財務データから必要な条件に合致するデータを抽出し,利用者が扱いやすい表計算ソフトウェアデータに加工する。
- イ.個人情報を含むビッグデータを更に利活用するために,特定の個人を識別することができないように匿名化加工する。
- ウ.住所データ項目の中にある,"ヶ"と"が"の混在や,丁番地の表記不統一を,標準化された表記へ統一するために加工する。
- エ.ソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。
正解
エ. ソーシャルメディアの口コミを機械学習によって単語ごとに分解し,要約を作り,分析可能なデータに加工し,関係データベースに保管する。
解説
非構造化データ(自由テキスト等)を構造化(表形式・関係DB形式)に加工する例は、SNS の口コミを機械学習で単語分解・要約して関係 DB に格納するエが該当します。エが正解。
選択肢ごとの解説
- ア.関係 DB のデータを表計算データに変換するのは構造化→構造化で、非構造化からの加工ではありません。
- イ.匿名化加工はプライバシー保護で、構造化加工ではありません。
- ウ.住所表記の統一はデータクレンジングで、構造化→構造化の正規化処理です。
- エ.自然文の口コミを機械学習で構造化データに変換する、非構造→構造の典型例で正解です。
基本情報技術者試験 令和6年度 科目A 公開問題 の過去問一覧へ戻る・問15