いわゆる「JIS2004問題」

 実は、表外漢字字体表が答申された後、表外漢字字体表の1022字をすべてJIS X 0208に収録すべきか否か、という議論が起こった。しかし、JISの漢字コード委員会は、JIS X 0208は改正せず、別の漢字コード規格「JIS X 0213」を2004年2月に改正するという形で、表外漢字字体表に対応した。

 マイクロソフトは2007年1月に発売した「Windows Vista」で、2004年版のJIS X 0213(「JIS X 0213:2004」、マイクロソフトは「JIS2004」と呼ぶ)に対応した。しかしその際、シフトJISを変更してJIS X 0213に対応するのではなく、UTF-16とUTF-8に限定してJIS X 0213に対応した。この結果、新しい常用漢字表のうち、「𠮟」「塡」「剝」「頰」の4字がシフトJISに含まれない(図4)、という事態が起こった。

図4●新しい常用漢字表と文字コードの関係
新しい常用漢字表は、シフトJISに収まらないだけでなく、UCS-2にも収まらない。口へんに七の「しかる」は、UCS-2に収まらない4バイト文字である。
[画像のクリックで拡大表示]

システムのUnicode対応が必須

 したがって「𠮟」「塡」「剝」「頰」の4字を含む新しい常用漢字表をサポートするためには、文字コードは、クライアント側、サーバー側を含めて、 UTF- 16かUTF-8を使うしかないだろう。現時点ではクライアント側にWindows Vista、Windows 7、Mac OS 10.5以降など、2004年版JIS X 0213に対応した表示・処理システムを使わねばならない。

 Windows XPの場合は、マイクロソフトのWebサイトからダウンロードできる「Windows XPおよびWindows Server 2003向けJIS2004対応MSゴシック&MS明朝フォントパッケージ」や「メイリオ」といった2004年版JIS X 0213対応フォントをインストールし、後述する「サロゲートペア」に対応したアプリケーション(マイクロソフトの「Office 2007」など)を使用すれば、新しい4字を表示・処理できる。

 アプリケーションやシステムが新常用漢字表に対応できるか否かは、「𠮟」(口へんに七)への対応度合いが判断の基準となる。これを「叱」で誤魔化すようでは、新しい常用漢字表への対応という点で破綻を来す。

 Unicodeのエンコーディングには、UCS-2、UTF-16、UTF-8がある。UTF-16は、UCS-2に「サロゲートペア」という2バイトの文字を2つ組み合わせて1文字とする仕組みを追加したもので、UCS-2の上位互換である。

 Windows XP以前のWindowsやMac OS 9は、UTF-16は十分にはサポートしておらず、基本的にはUCS-2での処理しかできない。このためOffice 2007では対応できても、Windows XPの「メモ帳」はサロゲートペアである「𠮟」(口へんに七)を2つの文字として扱ってしまう。

 新しい常用漢字表2136字をすべてサポートできるかどうかは、ひとえにUTF-16のサロゲートペアやUTF-8の4バイトコードを正常に処理できるかどうかにかかっている。「𠮟」はその試金石となる。

今からでも声を上げられる

 どうしても「𠮟」がサポートできそうにないなら、その旨を文化審議会国語分科会に陳情する、という手も残されている。新しい常用漢字表は改正案の段階であり、2009年12月24日までは一般からのコメント(パブリックコメント)を受け付けているからだ。「𠮟」ではなく「叱」を常用漢字にしてほしい、あるいは、「𠮟」の「許容字体」として「叱」を認めてほしい、と陳情するのだ。

 許容字体とは、図2の角カッコで表されている字体で、カッコ外の字体の代わりに利用できる。実際、日本新聞協会からの陳情で、2点しんにゅうの「」に対して、1点しんにゅうの「」が許容されたという経緯がある。国民からの陳情が多ければ、「𠮟」に対して「叱」を許容字体として認める余地くらいは残っているはずだ。その意味では、「塡」「剝」「頰」に対する「填」「剥」「頬」も同様だろう。

JISの漢字コードにも影響の可能性

図5●新しい常用漢字表とJIS X 0208の例示字体が異なる19字
新しい常用漢字表にある19文字は、JIS X 0208の例示字体が異なる。これらの文字を新しい常用漢字表の字体で表現するためには、JIS X 0213:2004(一部では「JIS2004」と呼ばれる)に対応したフォント(Windows Vista/7に標準搭載されている「メイリオ」や「MS明朝/ゴシック」。これらはWindows XPにもダウンロード提供されている)を使用する必要がある。
[画像のクリックで拡大表示]

 2000年の表外漢字字体表で改正されなかった「JIS X 0208」が改正される可能性もある。

 JIS X 0208の「附属書6」は、1981年10月告示の常用漢字表を引用している。これが改正されればJIS X 0208も改正せざるを得なくなる。また、図5に示す19字については、新しい常用漢字表の字体がJIS X 0208の例示字体とは明らかに異なっている。JISとしては、例示字体の入れ替えなど、何らかの手当をする必要があるだろう。

 もっとも、JISの改正を待ってから既存システムの改変を行っていたのでは、常用漢字表改正への対応としては、あまりに遅すぎる。読者の皆さんには、システムごとにどのような改変が必要かを調査し、文字コードの変更というドラスティックな改変を含め、新たな常用漢字表への対応を今から準備しておくことを推奨する。

安岡 孝一
京都大学人文科学研究所附属
東アジア人文情報学研究センター 准教授
1965年大阪府堺市生まれ。90年京都大学大学院工学研究科情報工学専攻修士課程を修了し、同年京都大学大型計算機センター助手に就任。 2000年より現職。京都大学博士(工学)。『文字符号の歴史 欧米と日本編』(共立出版)、『キーボード配列 QWERTYの謎』(NTT出版)など著書多数。
■変更履歴
図3において、「剝」(剥の旧字)の文字コードをUCS-2とUTF-16が「5265」、UTF-8が「E5 89 A5」としていましたが、正しくはUCS-2とUTF-16が「525D」、UTF-8が「E5 89 9D」でした。お詫びして訂正します。本文は修正済みです。[2009/12/11 15:00]

この先は会員の登録が必要です。今なら有料会員(月額プラン)登録で5月末まで無料!