Huh! Atz sem tudom kinek válaszoljak előbb :)
A HTML látom sokakat érzékenyen érint. Sajnos mi sem fogunk tudni ebben rendet teremteni - még petíciót sem tudnánk kinek küldeni (sóhivatal?).
Egyikőtök, azt mondja a meta infó kisebb prioritásű mint a head, a másikotok azt mondja rosszul van összerakva a cucc és a böngészúben nem is szabadna ilyen kódlap váltónak lennie, és a felhasználónak erről a dologról nem is szabad tudnia. Egyezzünk meg abban, hogy a felhasználónak mindent szabad/lehet - ha Ő az iso8859-1 -et mint KOI8 -as orosz kódlapként szeretné megnézni, tegye, mi meg legyünk azon, hogy világos és helyes honlapokat készítsünk.
Másikotok azt mondja át kell állni utf8 -ra minden kis piszlicsáré programban - valóban nincs más kiút, ez most a belátható jövő. A 8 bites kódolás egy történelmileg kialakult forma, amit a 8 (még régebben 7) bites kommunikációs átviteli csatornák alapoztak meg - így volt természetes. De ez roppant sok idő és pénz illetve sz'vás, ráadásul, mi a helyzet a különféle vezérlő jellegű programokkal? Olyan lakonikus és egyszerű szövegeket kommunikál min pl. "Állj" akkor ezt most valamelyik oldalon össze-vissza kell konvertálgatni. Ami eddig sima kis C string volt most, wide verzióra kell cserélni - valahol :) Ráadásul, pl. az NT4.0 vagy a W98nem biztos hogy jól kezeli az UTF8 -at.
Adatbázisok. Hát-hát, elég sokat kell velük szkanderezni, és mi a helyzet a kollíziós táblákkal? Ugye nem azt akarod mondani, hogy lapátoljuk be binarás blob -ként az adatokat, aztán majd a kliens leválogatja, rendezi? A tábláknak szerintem ismernie kell a kódlapot.
Az apache viselkedése nem függ a kódtáblától - és ha fájl listát tesz ki?
A samba felhasználók számára mindegy a gép kódlap,no igen, de mint rendszergazda azért nekem is itt-ott bele kell túrnom a fájlokba, és roppant bosszantó ha nem tudom használni a Midnight Commandert. így is gond, hiszen az UTF8 US Enlish vagy Magyar teljesen másként jelenik meg az mc egy iso8859-2 -n. Mi a helyzet a szokásos ssh mentésekkel és másolatokkal (a minap valószínűleg ezt sz'vtam meg, egy eredetileg mc -vel iso8859-2 alatt szerkesztett shell script hibákat okozott egy UTF8 -as gépen, több óra töprengés és értetlenség).
Azt mondja a levelezési archívumokat nem kell bántani, jó lesz ahogy van - ezt könnyű lesz kipróbálni, hiszem ha látom.
Szóval nem arról kellene beszélni, hogy minek kéne lennie, hanem hogyna lehet megvalósítani, működőképessé tenni a dolgokat. Látom hogy az utf8 migrálás megkerülhetetlen, szeretnék a felmerülő problémákra a lehető legjobban rákészülni.
Kezd a topic szétzuhanni - bennem van a hiba, túl globális kérdést vetettem fel :(
* Én egy indián vagyok. Minden indián hazudik.