(内容の正確さは保証しない。)
日本語で範囲を表すとき、「〜」という文字が使われる。 かな漢字変換では、ふつう「から」で入力できる。いわゆる約物の一種。 JISでは波ダッシュ、Unicode では WAVEDASH, と呼ばれる。
JIS (JIS C 6226-1978, JIS X 0208:1983, JIS X 0208:1990 のどれでもそう) の 1-33 であり、 Shift_JIS では 0x8160, Unicode point では U+301C となる。
(ISO-2022-JP だと 0x21, 0x41, 日本語 EUC だと 0xa1, 0xc1, ということになるのかな。 UTF-8 だと 0xe3, 0x80, 0x9c なのかな??)
(チルダ 「~」 (ASCII 0x7e) と字形が似ている。)
これは Unicode にある全角チルダ (FULLWIDTH TILDE) 「~」としばしば混同される。 こちらの Unicode point は U+FF5E である。 (UTF-8 だと 0xef, 0xbd, 0x9e なのかな??) これは対応する文字は JIS にはないそうだ。そのせいか Shift_JIS にもない。 (余談だけど、これは Mac の日本語入力でどうやって入力できるのかな。 実はまだ知らない。)
私が普段使っている環境では、 「〜」と「~」両者の見た目は同じで、私には区別がつかない。 以前は、Unicode での波ダッシュのフォントが “間違って”、 「上がって下がって上がる」でなく「下がって上がって下がる」になっていて、 そのときは容易に区別がついたそうだが。 現在では Unicode が変更されて、 波ダッシュが「上がって下がって上がる」になったそうだ。 それで区別がつけにくい。
さて。LATEX を使うときは? 私の普段の環境では、波ダッシュはそのまま「〜」で良いだろう。
全角チルダ「~」は?あれそのままで組版されるみたい(??)。 LATEX の otf パッケージの \UTF{} を使って \UTF{FF5E} とする必要があるかと思ったけれど。 ちなみにそうすると「FF5E」となる (これでPDFではちゃんと表示出来る。LaTeX2HTML では FF5E となってしまう)。
ちなみに\UTF{301C} とすると「301C」となる (これもPDFではちゃんと表示出来るが、LaTeX2HTML では 301C となる)。
しかしPDFでは、見た目で区別がつかない (まあ、使うフォントによるのだろうけれど)。 Mac のプレビューで表示させてからコピペすると、 どちらも半角のチルダ (0x7e) になってしまう。混乱のもとだ。
LaTeX2HTML で変換した WWW ページの方はどうなのだろう。 あ、どうも正しく変換できているようだ。WWWページから、 「〜」と「~」をコピぺして
% echo 〜|od -cx 0000000 〜 ** ** \n 80e3 0a9c 0000004 % echo ~|od -cx 0000000 ~ ** ** \n bdef 0a9e 0000004 % |
見て区別できるフォントが望ましいけれど、あまり神経質になる必要はないのかな。 正しく入力できる手段を探すのか。
ついでに全角ダッシュと長音記号 全角ダッシュ「—」(JIS 1-1-29, ISO-2022-JP 0x21, 0x3d, Unicode U+2014, UTF-8 0xe2, 0x80, 0x94) と長音記号「ー」(JIS 1-1-28, ISO-2022-JP 0x21, 0x3c, Unicode U+30FC, UTF-8 0xe3,0x83,0xbc) を調べよう。
ずっと以前、まだ PC と Sun ワークステーションだけを使っていた頃、 Mac を使っている人から届くメールに長音記号「ー」が多用されていて、 違和感を持ったものである。Mac で使われるフォントの多くで、 全角ダッシュ「—」と長音記号「ー」の見分けがつかないせいであるらしい。 いつの間にか、自分がそれをしてしまう人間になっていたようだ。
Mac の日本語入力では、全角モードにして、 マイナス '-' をタイプすると、長音記号になる。
ダッシュの入力法が見当たらないので、ユーザー辞書に登録した。