7 日本語テキストのソート (知らなかった)

単語帳のようなのを作っていて、読みでアイウエオ順に並べたくなった。

sample.txt
先端数理科学研究科 せんたんすうりかがくけんきゅうか 名詞
国際日本学部 こくさいにほんがくぶ 名詞
実験実習費 じっけんじっしゅうひ 名詞
総合数理学部 そうごうすうりがくぶ 名詞
現象数理 げんしょうすうり 名詞
現象数理学科 げんしょうすうりがっか 名詞

この解決策は良く知られているらしい。 環境変数 LC_ALL の値を C にして、 sort コマンドを実行するのだそうです。
env LC_ALL=C sort -k 2 sample.txt

ja_JP.UTF-8 とかでなくて、C で良いのか…

桂田 祐史
2020-04-20