internetről letöltött fájlok
Valahol itt kezdődik a gubanc. Egyszer dolgoztam 2M email headerrel. Ahhoz, hogy rendesen indexelni tudjam meg kellett határozni a karakterkeszletet. A végeredmény 24 féle jól definiálható kódolás lett, amiből az utf-8 csak egy volt. Volt egyetlen olyan subject, aminek a kódolása - egyszerűen rákeresve - egyetlen weboldalon szerepelt. Az adott levél írója az onnan kimásolt megnevezést másolta a levélbe.
Szóval a zinterneten nagy a katyvasz, ezért őszinte csodálattal és tisztelettel bámulom, ha egy weboldal ennek ellenére megjelenik vagy az email mégis odaér valahova.
A kevesebb munkát igénylő megoldás lehet az iconv segítségével ellenőrizni/egységesíteni a kódkészletet. Mondhatnám, ahol ntfs a tipikus ott nem divi az iconv, de most már a vindózon is van linux, nem csak a turmixgépen. ;)