俗字とか異字体とかの文字コードを調べる

2008年05月17日 公開

そもそも、俗字とか異字体とかって、正しくない字なので、このデジタル時代になって消えて無くなっちゃえばいいという意見もある。でも、地名とか人名とかにすでに使われてしまっているので、そうそう「今日から俗字は禁止です」とも言いにくいのがニッポン。既得権益は何が何でも保護するスタイルだからだ。

フツーに変換して表示することは、かなり難しい。しかし、ネットもunicodeの普及により、今まで表示できなかった文字も表示できるようになったりすることがあります。ただし、Internet Explorer6では無理なこともありますから、FirefoxとかSafariとか、せめて新しい Internet Explorer とか使ってくださいね(IE7でも表示できませんけど)。

では《Unicode/CJK統合漢字》で調べてみましょう!!

さて。例えば、「喜」の俗字。「七」が3つ積み重なったアレですが、《Unicode/CJK統合漢字》にアクセスすれば、簡単に探せます。部首や画数、読みなどで検索することができます。ためしに画数で探してみます。「七」が3つ重なった字なので6画ですから……[総画数検索]→[6画]とクリックすると、部首ごとに分類されて表示されます。

ここに、コードが記されています。漢字一覧の上が「UCS」にチェックされていたら、それがunicode。実際にwebでは「㐂」と記述すると「㐂」が表示されるというわけです。こんなコトしても、検索にひっかかりにくくなるだけですが、たとえ検索にひっかからなくても正しく書きたい時って──ありますよねぇ?

そのようにして「あられ せんべい 鶯谷 寿々喜」とタイトルをつけましたが、文末の店舗紹介では「鶯谷 寿々㐂」と表示するようにしました。

日本語以外も表示できるのがunicodeですから、わざわざ「深セン(土へんに川)」とか書いている中国の地名も「深圳」とすることで「深圳」と表示することができるようになります。なんかヘンな感じ。

これならば、「ぬでしま(ぬてじま)」が前橋の町名にもなっているし群馬では姓としても使われているのに「ぬで島」とか「ヌデ島」とか書いているものも「橳島」と表示することができますね。なんとか。ちなみに、コードは6A73ですので、HTMLには「橳」と書き込みます。

ちなみに、漢字変換FEPによっては変換できるものもあります。でも、たいてい読みがわからなかったりしますよね。手書き文字入力で認識されないこともありますよね(うちのパソコンで「土」の俗字「圡」は手書き入力で認識しませんでした……よみかた「ど」で変換できるのになー?)。

古いブラウザでご覧の方は、文字が正しく表示されていないことがあると思われます。また、表示できても1文字だけ明朝体になって表示されることがあるかもしれません。また、中国語フォントがインストールされていないと全然見られないかもしれません。

.