31 ドイツ語文書を Google 翻訳する

論文が英語の場合は何とか読めるというか、読めないといけないけれど、 ドイツ語、フランス語になると、正直私には難しい (第二外国語は大学1年生のときが一番出来たような気がします)。

最近はGoogle翻訳を使って英語に直して読んでいます。

論文は大抵は PDF ファイルで、以前は段落ごとに PDF からコピペをしていましたが、 pdftotext を覚えたので、 pdftotext なんとか.pdf としてテキスト・ファイルにします。 (原語のテキスト・ファイルも作っておくと、何かと便利。)

ところで、 古い論文はスキャンしたものを OCR してあり、OCR の精度が低くて、 あまりちゃんとしたテキスト・ファイルにならないことがほとんどです。 特にアクセント記号が読めていないことが多く、 今のところはエディター (emacs) で読み込んで手で直しています (検索置換をするけれど、どうもスッキリとは行かないのが悩みのタネです)。

余談: とある漫画で、ドイツ製のものの偽物を作る際に、 ü ii (筆記体なので二つの i がつながっている) に間違えたのを気づかないドジというのが出て来ましたが、 OCR はそういうドジをやってくれています (笑いました)。 OCR した人が英語用の OCR プログラムを使ったということなのかな。


スペルチェッカーみたいに、辞書と照らし合わせて、 修正候補を提示してくるように出来ないかな、とか妄想していますが、 いまのところはまだ妄想しているだけです。

それで Mac でアクセント記号をどのように入力するかですが、 今のところ次のやり方で凌いでいます。

たくさんあってギョッとしますが、ドイツ語の場合は、 option+u と options+s だけ覚えれば OK です。

細かい注意事項として、 ターミナル プログラムで “Treat ambiguous-width characters as double-width” を有効にすると、 表示がおかしくなります。

桂田 祐史
2020-04-05