基本情報技術者試験 過去問解説
ビッグデータとは?基本情報技術者試験 令和4年度 科目A 問23を解説
基本情報技術者試験 令和4年度 科目A 問23は、ビッグデータに関する理解を問う問題です。検索から入っても、問題文、選択肢、正解、解説、各選択肢がなぜ違うかをこのページだけで確認できます。
問題文
ビッグデータのデータ貯蔵場所であるデータレイクの特徴として,適切なものはどれか。
この問題の出題ポイント
- ビッグデータの定義だけでなく、問題文中の条件がどの選択肢に当てはまるかを確認する。
- データベース分野では、用語の目的・主体・責任範囲の違いが選択肢で問われやすい。
- 関連タグ: ビッグデータ、関係モデル。
選択肢
- アあらゆるデータをそのままの形式や構造で格納しておく。正解
- イデータ量を抑えるために,データの記述情報であるメタデータは格納しない。
- ウデータを格納する前にデータ利用方法を設計し,それに沿ってスキーマをあらかじめ定義しておく。
- エテキストファイルやバイナリデータなど,格納するデータの形式に応じてリポジトリを使い分ける。
正解
ア: あらゆるデータをそのままの形式や構造で格納しておく。
解説
データレイクはあらゆる形式(構造化・半構造化・非構造化)のデータをそのまま格納する貯蔵場所です。アが正解。
なぜ他の選択肢が違うのか
ア(正解)
そのままの形式・構造で格納するデータレイクの定義そのもので、正解です。
イ
データレイクではメタデータも重要で、格納します。
ウ
事前にスキーマ定義するのはデータウェアハウスの考え方(schema-on-write)で、データレイクは schema-on-read。
エ
データ形式ごとにリポジトリを分けるのは別アーキテクチャの説明で、データレイクの本質ではありません。
解き方の整理
ビッグデータの問題では、選択肢のキーワードだけで判断せず、問題文が示す条件と正解選択肢の説明が一致しているかを見ます。誤答選択肢は、似た用語を混ぜる、主体を入れ替える、目的や範囲を広げすぎる、という形で作られることが多いため、選択肢別解説まで確認しておくと復習効率が上がります。
関連用語
関連問題
前後の問題
令和4年度 科目A の関連する問題
復習を続ける
間違えた問題、苦手タグ、模試履歴を保存して復習する導線を用意しています。広告なしPro、弱点分析、復習リマインダーは段階的に提供予定です。