“𠮟る” と “叱る” 2014/12/01

口へんに右が”七”の”𠮟る”と右が”匕”の”叱る”は別々の文字らしい。自分の環境にある仮名漢字変換では”しかる”で変換して、どちらも候補に出てくる。

Unicodeの拡張領域にある文字(符号位置(コードポイント)が16ビットを超え、UTF8では4バイト、 UTF16でも4バイト必要な文字)としては、唯一の常用漢字として、右が”七”の”𠮟”があると知って調べたことのメモ。

“叱”のUnicode符号位置はU+53F1、”𠮟”のUnicode符号位置はU+20B9Fである。前者はJIS規格の第1水準に含まれ、 Shift-JISなどでも表現できるが、後者はJIS規格の第3水準で、ほとんどのShift-JISの実装では表現できない。

2つの文字は、手で文字を書くときには右の第1画の横線を左から書くか、右から書くかの違いがあり、まったく別の文字である。漢数字の”七と口へんの代わりに人へんのの”化”の右側のパーツは同じとは言えない。このパーツに口へんを付けた2つの漢字はやはり別の字である。

“𠮟”の音読みは”シツ”で、”叱”の音読みは”カ”である。どちらも漢字の右側が音読みを表す形声字と考えると、音読みが異なる別の文字だというのがわかる。形声字というのは、音読みを表すパーツとその字の意味を表すパーツの組み合わせてできた漢字である。 “しったげきれい”という言葉は”𠮟咤激励”と書き、1文字目は”しっ”なので、”𠮟”であり、 “カ”と読む”叱”を使うのは本来は不自然である。

モニタに表示される文字としては、”しかる”の漢字は”叱”のほうが見慣れている気がするが、常用漢字としては”𠮟”のほうだ。手元の紙の漢字辞典を引くと”しかる”は”𠮟る”と書いてある。

常用漢字表は2010年に改正されており、”𠮟”の文字はそのときに初めて常用漢字表の追加されている。それまでは”しかる”は常用漢字では書けなかった。”叱”は今も昔も常用漢字には含まれていない。しかし、その常用漢字表の中で、”𠮟”と”叱”の特別な関係についてちゃんと記載されている。

常用漢字表の中では、同じ文字の中でもトメハネなどの違いでさまざまなデザインがあることを解説している。フォントの違いによる表現の差であったり、活字と手書きとの違いもあり、中にはトメハネや線の向きにとどまらず、 “剥”と”剝”のように筆画が違うものも、同じ文字の「字形の違い」として許容している。

ただ、このデザイン差の解説の中で”𠮟”と”叱”に関してだけは、異体字(デザインが違うだけの同じ文字)としての使用実態がある現状を認めつつも、本来は別の字であるという解説がなされている。

2010年に常用漢字表に追加される前も、2000年に発表された表外漢字字体表には掲載されていた。その中でも”𠮟”については”叱”を個別にデザイン差として認めている。

JIS規格としては2004年より前(JIS X 0208:1997)は、”𠮟”と”叱”を区別することなく 1つの区点位置(コードポイント)で規定されていた。 UnicodeでもそれにマッピングするコードポイントとしてU+53F1が存在していたが、例示字形は”叱”であった。

ところが、2001年にUnicode 3.1がリリースされ、U+53F1の他に、U+20B9Fが追加された。追加された方の例示字形が”𠮟”になった。このとき追加された漢字はCJK統合漢字拡張Bと呼ばれ、この拡張は康熙字典に掲載されている漢字を網羅することが主な目的であった。 “𠮟”と”叱”は康熙字典にも別々の文字として登録されていることから、まだUnicodeに掲載されていない”𠮟”がこの領域に追加されたのは必然であった。

その後、2004年の新しいJIS規格(JIS X 0213:2004)では、文字の追加だけでなく、既存の文字も例示字形を表外漢字字体表に従うように改められた。例示字形が”叱”であった文字に関しても表外漢字に合わせて、”𠮟”に変更したいところだったが、変更するとなると、すでに両方の字体が別々に存在するUnicodeとのマッピングルールを変更しなくてはいけないため、やむなく”叱”の例示図形を変更せずに新たに”𠮟”がJIS規格に追加された。そして、例示字形が”叱”であった文字はもともとは”叱”と”𠮟”のどちらで使ってもよかったのが、 “叱”専用の区点位置(コードポイント)に変更された。

インターネット上で”しかる”を漢字で表現するには、ほとんどの場合JIS規格にもともと含まれている “叱”が使われてきた。2004年の新JIS規格で”𠮟”が追加されても、それは第3水準に含まれており、 Shift-JISのほとんどの実装では対応しておらず、実質使うことができなかった。そのため2004年以降も引き続き”叱”が多く使われている。 Unicodeでは”𠮟”が使えるのだが、コードポイントが16ビットを超え、 16ビットを前提とした初期のUnicodeの実装では使うことができなかった。 16ビットを超えるUnicodeの文字を扱うには、UTF8であれば4バイトの文字、 UTF16であればサロゲートペアをサポートしている必要がある。 “叱る”という文字に十分慣れてしまった後では、 “𠮟”が技術的に使えるようになったとしてもわざわざそっちを使うことは少ないかもしれない。

以上は、”叱”と”𠮟”がJIS規格とUnicodeの仕様に踊らされて、本来”𠮟”を使う場面で”叱”が使われるようになったかのような説明になってしまったが、JIS規格が登場する1978年より前の使用実態がどうだったのか、気になるところである。

なお、新JIS規格で第3水準とされている文字で常用漢字に含まれる文字は他にも3文字(“頰”, “剝”, “塡”)あるが、 Unicodeで16ビットを超える拡張領域にはみ出しているのは、常用漢字では”𠮟”だけである。