応用情報技術者試験 応用情報技術者試験 平成29年度秋期 午前 問4: UTF-8 の説明に関する記述として,適切なものはどれか。
UTF-8 の説明に関する記述として,適切なものはどれか。
57.99%
問題本文
UTF-8 の説明に関する記述として,適切なものはどれか。
選択肢
- ア.1 文字を 1 バイトから 4 バイト(又は 6 バイト)までの可変長で表現しており,ASCII と上位互換性がある。
- イ.2 バイトで表現する領域に収まらない文字は,上位サロゲートと下位サロゲートを組み合わせて 4 バイトで表現する。
- ウ.ASCII 文字だけを使用することが前提の電子メールで利用するために,7 ビットで表現する。
- エ.各符号位置が 4 バイトの固定長で表現される符号化形式である。
正解
ア. 1 文字を 1 バイトから 4 バイト(又は 6 バイト)までの可変長で表現しており,ASCII と上位互換性がある。
解説
UTF-8 は Unicode の符号化方式の一つで,1文字を1〜4バイト(規格上は最大6バイト)の可変長で表現する。ASCII と同じ文字は1バイトでまったく同じビット列になるため ASCII と上位互換性をもつのが最大の特徴であり,アが正しい。イ・ウ・エはそれぞれ別の符号化方式(UTF-16・UTF-7・UTF-32)の説明である。
選択肢ごとの解説
- ア.正しい。UTF-8 の定義そのもの。1〜4(最大6)バイトの可変長で,ASCII 範囲の文字は1バイトで ASCII と同一ビット列になる(上位互換)。
- イ.誤り。これは UTF-16 の説明。2バイト(基本多言語面)に収まらない文字を上位・下位サロゲートのペアで表すのはサロゲートペアであり UTF-8 ではない。
- ウ.誤り。これは UTF-7 の説明。ASCII のみ使える電子メール経路用に7ビットで表現する方式であり UTF-8 とは異なる。
- エ.誤り。各符号位置を4バイト固定長で表すのは UTF-32。UTF-8 は可変長なのでこの記述は当てはまらない。
応用情報技術者試験 平成29年度秋期 午前 の過去問一覧へ戻る・問4