feljegyzés magamnak:
Az Aozora Bunkoról letöltött (esetleg más forrásból beszerzett) japán nyelvű szöveges fájlok jellemzően Shift-JIS kódolásúak, ami kényelmetlen. Az alábbi paranccsal lehet őket a sokkal kulturáltabb UTF-8-cá alakítani:
perl -MEncode=from_to -pe'from_to($_,"shift-jis","utf-8")' eredeti.txt > javitott.txt
Ízlés szerint a -i kapcsoló is használható, ha nincs szükség az eredeti fájlra.
Lenne még ugye az iconv ugyanerre a célra, de az nagyon finnyás: az első, szerinte nem legális karakterre abbahagyja a konverziót.
Ha a fájlnevekkel is probléma van (ami elő szokott fordulni, ha egy zipből kerül elő a szöveges fájl), arra pedig a legkényelmesebb a convmv.