- ...
タベースになる1
- 野口悠紀男氏は、著作の中で文書作成のソフトウェア
として 5 つのタイプのものをあげているが、その 5 番目は「メーラ」となって
いる。「メーラをあえて文書作成ソフトとして評価対象としたのは、文書管理機
能が優れているためである。(中略) 管理機能の点でいえば、他の四つのタイプ
のソフトウェアに比べて、遜色のないものである。」
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
のようにしてしまうわけである2
- きちんとした印刷文書の場合には、
単語の途中でハイフンを入れて次の行に続ける
-- この作業を hyphenation と呼ぶ -- とか、
単語間の空白を調整してちょうど行の終りに単語の終りが来るようにする、
などの工夫をするが、
タイプライターなどで作成する文書では、行の終りが近づいたら、
適当な単語の終りで改行してしまう。
英文のテキスト・ファイルはこの「作法」に則って作成されるのが普通である。
例えば前回の実験に使った Gutenberg テキストを見よ。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
以上のことと少し関係するが3
- 英語の文章では行の終りは、
単語間の空白のように単語の切目を意味することが多いが
(例外は hyphenation してある場合)、
日本語の文章では行の終りは、単語の切目を意味しない。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
「形態素4
- 意味を有する最小の言語形態のことを形態素という。
英語で言う morpheme.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
このうち文字コードの問題だけは比較的簡単に解決できる5
- nkf, less, mule などのコマンドも、
日本語テキスト・ファイルの文字コードを自動判別して
適切に処理するようになっている。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
6
- lgrep を使いたい人は、
.cshrc にこのコマンドを書いておくと良い。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...Namazu7
-
Namazu について知りたければ、ホームページ
http://www.namazu.org/ を見よ。
なお、情報処理 II のページにもいくつか説明を用意してある。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
- ...
をあげておこう8
- なお、この著者のホームページ
http://www.horagai.com/ にも色々載っている。
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.
.