JLREQの文字クラス

| コメント(0) | トラックバック(0)

W3C「日本語組版処理の要件」(ワーキングドラフト 2011年11月29日) の文字クラスを整理してみた。

表も作ってみた。

ざっと見たところ、JIS X 4051:2004とのちがいは次のとおり (まちがいがあるかもしれない)。

  • ‐ (HYPHEN) がハイフン類 (cl-03) かつ欧文用文字 (cl-27) に含まれる。JISでは「ハイフン類」にのみ含まれる (?)。
  • №が前置省略記号 (cl-12) かつ漢字等 (cl-19) に含まれる。JISでは「前置省略記号」にのみ含まれる。
  • 数字、ラテン文字 (アクセントなしのみ)、ギリシア文字 (語末のシグマも)、キリル文字が、漢字等 (cl-19) かつ欧文用文字 (cl-27) に含まれる。JISでは「欧文中の文字」にのみ含まれる (cl-25関連は同じ)。
  • ¬ ∀ ∃ ∅ ∠ - (HYPEN-MINUS) ∮ ⌒が漢字等 (cl-19) や演算記号 (cl-18) に含まれず、欧文用文字 (cl-27) にのみ含まれる。JISでは「和字」かつ「欧文中の文字」に含まれる。
  • ⊿が漢字等 (cl-19) にのみ含まれる。JISでは「和字」かつ「欧文中の文字」に含まれる。
  • ⧺ ⧻が漢字等 (cl-19) かつ欧文用文字 (cl-27) に含まれる。JISでは「和字」にのみ含まれる。
  • ﹅ ﹆がない (当然、圏点処理では言及される)。JISでは「和字」にある。

単位記号・割注関連以外:

単位記号・割注関連:

UTR#50のドラフト (rev. 2) のデータファイルの結果も挙げておくが、なにをしたいのかいまひとつよくわからない。

トラックバック(0)

トラックバックURL: http://hatuka.nezumi.nu/cgi-bin/mt/mt-tb.cgi/37

コメントする

このブログ記事について

このページは、Hatuka*nezumiが2011年12月28日 12:53に書いたブログ記事です。

ひとつ前のブログ記事は「受電ストライキをします」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。