Unicode Standard と JIS X 4051 との比較: 行分割(1)

| トラックバック(0)
Unicode Standard と JIS X 4051:2004 『日本語文書の組版方法』との比較をする。 まず、行分割について。

表1 Line Breaking Propertyを作った。

ばっと見て気づくこと:

  • (1) 始め括弧類と (2) 終わり括弧類のそれぞれ一部が、UAX#14 では QU 曖昧な引用符 に割り当てられている。
  • Vertical Presentaion Form はほとんどが Normalized Form と同じ class だが、次のものだけ変:
    • 1-1-29V ︱ EM DASHV
    • 1-1-37V ︰ TWO DOT LEADERV
    • 1-3-92V ︲ EN DASHV
  • 次のものは UAX#14 では NS 行頭禁則文字に割り当てられているが、 JIS ではそうなっていない。なにかわけがあるのか?
    • 1-2-23 〼 MASU MARK
    • 1-6-88 ㇷ゚ KATAKANA LETTER SMALL HU + COMBINING KATAKANA-HIRAGANA SEMI-VOICED SOUND MARK
  • JIS での (2) 終わり括弧類 から (7) 区点類 までは文字幅の区分のためだけの分類だろう。
  • 次のものは UAX#14 では B2 両側改行可能 に割り当てられているが、 JIS では (8) 分離禁止文字 に割り当てられており、矛盾している:
    • 1-1-29 ― EM DASH
  • UAX #14 では、片仮名の Normalized Form は ID 象形文字的 に割り当てられているのに、 Halfwidth Form は AL アルファベット的 に割り当てられている。
  • いっぽう、Fullwidth ASCII が ID 象形文字的 に割り当てられているのは組版の利便のためだろう (JIS X 0213 は文字幅の区別を持たないので、このようなことができない。 欧文用文字を文脈によって和字として扱うことになるだろう)。 COLON と SEMICOLON も同様で、Normalized Form は CL 終わり括弧類に、Fullwidth Form は NS 行頭禁則文字に割り当ててある

トラックバック(0)

トラックバックURL: http://hatuka.nezumi.nu/cgi-bin/mt/mt-tb.cgi/22

このブログ記事について

このページは、Hatuka*nezumiが2006年5月 1日 20:22に書いたブログ記事です。

ひとつ前のブログ記事は「翻訳作業の補助」です。

次のブログ記事は「Unicode Standard と JIS X 4051 との比較: 行分割(2)」です。

最近のコンテンツはインデックスページで見られます。過去に書かれたものはアーカイブのページで見られます。