50 波ダッシュ「〜」

(内容の正確さは保証しない。)


日本語で範囲を表すとき、「〜」という文字が使われる。 かな漢字変換では、ふつう「から」で入力できる。いわゆる約物の一種。 JISでは波ダッシュ、Unicode では WAVEDASH, と呼ばれる。

JIS (JIS C 6226-1978, JIS X 0208:1983, JIS X 0208:1990 のどれでもそう) の 1-33 であり、 Shift_JIS では 0x8160, Unicode point では U+301C となる。

(ISO-2022-JP だと 0x21, 0x41, 日本語 EUC だと 0xa1, 0xc1, ということになるのかな。 UTF-8 だと 0xe3, 0x80, 0x9c なのかな??)

(チルダ 「~」 (ASCII 0x7e) と字形が似ている。)

これは Unicode にある全角チルダ (FULLWIDTH TILDE) 「~」としばしば混同される。 こちらの Unicode point は U+FF5E である。 (UTF-8 だと 0xef, 0xbd, 0x9e なのかな??) これは対応する文字は JIS にはないそうだ。そのせいか Shift_JIS にもない。 (余談だけど、これは Mac の日本語入力でどうやって入力できるのかな。 実はまだ知らない。)


私が普段使っている環境では、 「〜」と「~」両者の見た目は同じで、私には区別がつかない。 以前は、Unicode での波ダッシュのフォントが “間違って”、 「上がって下がって上がる」でなく「下がって上がって下がる」になっていて、 そのときは容易に区別がついたそうだが。 現在では Unicode が変更されて、 波ダッシュが「上がって下がって上がる」になったそうだ。 それで区別がつけにくい。


さて。LATEX を使うときは? 私の普段の環境では、波ダッシュはそのまま「〜」で良いだろう。

全角チルダ「~」は?あれそのままで組版されるみたい(??)。 LATEX の otf パッケージの \UTF{} を使って \UTF{FF5E} とする必要があるかと思ったけれど。 ちなみにそうすると「FF5E」となる (これでPDFではちゃんと表示出来る。LaTeX2HTML では FF5E となってしまう)。

ちなみに\UTF{301C} とすると「301C」となる (これもPDFではちゃんと表示出来るが、LaTeX2HTML では 301C となる)。

しかしPDFでは、見た目で区別がつかない (まあ、使うフォントによるのだろうけれど)。 Mac のプレビューで表示させてからコピペすると、 どちらも半角のチルダ (0x7e) になってしまう。混乱のもとだ。


LaTeX2HTML で変換した WWW ページの方はどうなのだろう。 あ、どうも正しく変換できているようだ。WWWページから、 「〜」と「~」をコピぺして
% echo 〜|od -cx
0000000   〜  **  **  \n
             80e3    0a9c
0000004
% echo ~|od -cx
0000000   ~  **  **  \n
             bdef    0a9e
0000004
%
となる。0xe3,0x80,0x9c と 0xef,0xbd,0x9e で違いが分かる。

見て区別できるフォントが望ましいけれど、あまり神経質になる必要はないのかな。 正しく入力できる手段を探すのか。


ついでに全角ダッシュと長音記号      全角ダッシュ「—」(JIS 1-1-29, ISO-2022-JP 0x21, 0x3d, Unicode U+2014, UTF-8 0xe2, 0x80, 0x94) と長音記号「ー」(JIS 1-1-28, ISO-2022-JP 0x21, 0x3c, Unicode U+30FC, UTF-8 0xe3,0x83,0xbc) を調べよう。

ずっと以前、まだ PC と Sun ワークステーションだけを使っていた頃、 Mac を使っている人から届くメールに長音記号「ー」が多用されていて、 違和感を持ったものである。Mac で使われるフォントの多くで、 全角ダッシュ「—」と長音記号「ー」の見分けがつかないせいであるらしい。 いつの間にか、自分がそれをしてしまう人間になっていたようだ。

Mac の日本語入力では、全角モードにして、 マイナス '-' をタイプすると、長音記号になる。

ダッシュの入力法が見当たらないので、ユーザー辞書に登録した。



桂田 祐史