next up previous
: データの圧縮用コマンド : 情報処理II 第7回 情報の電子化 (3) : 例.

データ・フォーマットの選択についての注意事項 -- 文書を例として

文書を電子化するための形式 (データ・フォーマット) として、 テキスト・ファイルを紹介したが、それは非常に単純なもので、 文書の中にどういう文字がどういう順番で現れるかだけしか表現できない。

一方で世の中で実際に使われている (印刷された、あるいは手で書かれた) 文書には、レイアウトや、文字の大きさ、色なども重要な要素である場合があ る。さらには図、写真などが含まれる文書も多い。これらの文書を電子化する には、テキスト・ファイルでは不十分であることは説明するまでもなく明らか である。

そのため、このような文書を扱うソフト (ワードプロセッサー、DTP ソフト、 WWW ブラウザー、TEX のような文書整形システム, etc.) では、独自のデー タ・フォーマットが採用されている。

独自形式のデータ・フォーマットで電子化された文書は、それを読むために もそれに対応したソフトを必要とする。そのため次のような問題が生じうる。

自分が入手・作成するデータのフォーマットとして何を選択するか、慎重に 考える必要がときどき生じる。

ソフトを作るのは企業である場合が多く、企業の利益を守るために、データ フォーマットを非公開にしたりするなど、必ずしもユーザーの利益優先では考 えてくれないことを肝に命じておこう。

きれいに見栄え良く表示・印刷できることは気持の良いことで、時には最も 重要なことであるが (少し考えれば例はいくらでも見つかる)、ものによって は、多くの人が手軽に利用できること、また長期にわたって保存できることの 方が重要な場合もある。そういうわけでテキスト・ファイルもかなり役立つこ とがある5

(日本語のテキスト処理についても実例つきで説明したかったのですが、 準備が間に合いませんでした。後日、準備が出来たら説明します。)



Masashi Katsurada 平成12年6月22日