基本情報技術者試験 過去問解説

ビッグデータとは?基本情報技術者試験 令和4年度 科目A 問23を解説

基本情報技術者試験 令和4年度 科目A 問23は、ビッグデータに関する理解を問う問題です。検索から入っても、問題文、選択肢、正解、解説、各選択肢がなぜ違うかをこのページだけで確認できます。

問題文

ビッグデータのデータ貯蔵場所であるデータレイクの特徴として,適切なものはどれか。

この問題の出題ポイント

  • ビッグデータの定義だけでなく、問題文中の条件がどの選択肢に当てはまるかを確認する。
  • データベース分野では、用語の目的・主体・責任範囲の違いが選択肢で問われやすい。
  • 関連タグ: ビッグデータ、関係モデル。

選択肢

  1. あらゆるデータをそのままの形式や構造で格納しておく。正解
  2. データ量を抑えるために,データの記述情報であるメタデータは格納しない。
  3. データを格納する前にデータ利用方法を設計し,それに沿ってスキーマをあらかじめ定義しておく。
  4. テキストファイルやバイナリデータなど,格納するデータの形式に応じてリポジトリを使い分ける。

正解

: あらゆるデータをそのままの形式や構造で格納しておく。

解説

データレイクはあらゆる形式(構造化・半構造化・非構造化)のデータをそのまま格納する貯蔵場所です。アが正解。

なぜ他の選択肢が違うのか

  • ア(正解)

    そのままの形式・構造で格納するデータレイクの定義そのもので、正解です。

  • データレイクではメタデータも重要で、格納します。

  • 事前にスキーマ定義するのはデータウェアハウスの考え方(schema-on-write)で、データレイクは schema-on-read。

  • データ形式ごとにリポジトリを分けるのは別アーキテクチャの説明で、データレイクの本質ではありません。

解き方の整理

ビッグデータの問題では、選択肢のキーワードだけで判断せず、問題文が示す条件と正解選択肢の説明が一致しているかを見ます。誤答選択肢は、似た用語を混ぜる、主体を入れ替える、目的や範囲を広げすぎる、という形で作られることが多いため、選択肢別解説まで確認しておくと復習効率が上がります。

関連用語

関連問題

前後の問題

令和4年度 科目A の関連する問題

復習を続ける

間違えた問題、苦手タグ、模試履歴を保存して復習する導線を用意しています。広告なしPro、弱点分析、復習リマインダーは段階的に提供予定です。