応用情報技術者試験 応用情報技術者試験 平成31年度春期 午前 問29: ビッグデータのデータ貯蔵場所であるデータレイクの特徴として,適切なものはどれか。
のデータ貯蔵場所であるの特徴として,適切なものはどれか。
67.41%
選択肢
- ア.あらゆるデータをそのままの形式や構造で格納しておく。
- イ.データ量を抑えるために,データの記述情報であるメタデータは格納しない。
- ウ.データを格納する前にデータ利用方法を設計し,それに沿ってスキーマをあらかじめ定義しておく。
- エ.テキストファイルやバイナリデータなど,格納するデータの形式に応じてリポジトリを使い分ける。
正解
ア. あらゆるデータをそのままの形式や構造で格納しておく。
解説
データレイクの設計思想を問う問題である。データレイクは、構造化・非構造化を問わずあらゆるデータを加工せず元の形式・構造のまま大量に蓄えておき、後から必要に応じて利用方法を決めて分析する貯蔵場所である。あらかじめスキーマを定義してから格納するデータウェアハウスとはこの点が対照的であり、アが正解である。
選択肢ごとの解説
- ア.あらゆるデータを元の形式・構造のまま格納するという、データレイクの本質的な特徴を正しく述べている。
- イ.データレイクではどのデータかを後から把握できるようメタデータも管理するのが一般的であり、「格納しない」は誤り。
- ウ.格納前に利用方法を設計しスキーマを定義しておくのはデータウェアハウス(スキーマ・オン・ライト)の考え方であり、データレイクとは逆である。
- エ.データレイクは形式を問わず一元的に蓄えるのが特徴であり、形式ごとにリポジトリを使い分けるという説明は当てはまらない。
応用情報技術者試験 平成31年度春期 午前 の過去問一覧へ戻る・問29