ユニバーサル文字とは何の謂ぞ

Internet Explorer 4.0の[表示]→[インターネットオプション]→[フォント]の[文字セット]にある,「ユニバーサル文字」というのは何ですか。


この設定は,Unicodeに関するものです。漢字などの2バイト文字にはいくつか文字コードの規格が存在します。日本語ではシフトJIS,JIS,EUCが代表的で,この文字コードが違うと,2バイト文字がうまく表示されません。そこで,これらをまとめて一つの文字コードで扱おうとしたのがUnicodeです。
 なお,Unicodeでは文字だけを扱っており,言語やグリフ(実際の文字の表示形状)は含まないので注意してください。
 Internet Explorer 4.0の文字セットの設定をよく見れば分かりますが,ここには「UTF-8」と書かれています。これは「UCS Transformation Format 8」の略で,Unicode 1.1であるUCS-2(Universal Multiple-Octet Coded Character Set)を8ビット環境下で使いやすいようにエンコードするためのフォーマットです。
 文字どおり,Unicode(UCS)を8(ビット)に変形(Transformation)するためのフォーマット(Format)で,このUTF-8をユニバーサルな文字セットとして利用する設定が「ユニバーサル文字」です。
 もっとも,現状ではUnicodeを使って書かれたホームページは筆者の知る限りありません。実際に使用するケースはほとんどないでしょう。
(恣岡 悄)


「文字セット」の欄をよく見ると「ユニバーサル文字(UTF-8)」と書かれている