karakterkódolási gond...

Sziasztok!

A segítségeteket kérném ismét :). A problémám a következő:
adott egy oldal, ami eddig magyarul jelent meg. Az adatbázis, a fáklok, és minden iso-8859-2 kódolással vannak mentve / szerkesztve... Az a feladatot kaptam, hogy románosítsam meg a szájtot, csakhogy van kb 5 román karakter, amik utf-8 ban vannak csak, és nem tudom mi tévő legyek. Ezek a román karakterek 1 külön fájlba vannak eltárolva. Ha a fájlokat átteszem utf-8-ba akkor az adatbázisból jövő tartalmak esnek szét, ha pedig marad a iso-8859-2 akkor meg az újonnan behozott szövegek :( Ha valaki tudja mi a meoldás, vagy csak van egy tippje, kérem ne habozzon megosztani velem :)
Köszönöm szépen.

Hozzászólások

Itt az ideje, a kezdetekben hozott hibás döntést (ISO-8859-2 kódolás) korrigáld, azaz a teljes tartalmat (ha jól értem, akkor adatbázis és fájlok is) átkonvertáld UTF-8-ra. Szép munka lesz, de legalább a jövőben mindig, mindenhol utf-8-as kódolást fogsz használni.

Innen el tudsz indulni: http://forums.mysql.com/read.php?103,53516,57893

A gányolást (külön fájl a kérdéses 5 román karakternek) kifejezetten javaslom mellőzni. Vagy eleve vegyél fel egy másik fájlt esetleg, abban meg tárold az ukrán karaktereket. Meg a lengyelt. Meg a szlovákot.

pedig en eddig ugy tudtam, hogy a latin2-ben a roman is benne van.
utananeztem: elmeletileg benne van, gyakorlatilag nem. :)
http://en.wikipedia.org/wiki/Iso-8859-2
hat igen, akkor utf8-ra kell konvartalni.
fajlokra iconv, adatbazist kidumpolod, iconv, majd import az uj ures db-be vissza.

Tyrael