[SOLVED] UTF-8 hibás karakterek javítása

Fórumok

Mit tudok tenni egy történetesen UTF-8 kódolású szövegfájllal, amiben a kétbájtos karakterek két karakterként lettek tárolva. Ez történetesen egy sql dump.

Az iconv-al próbálkoztam, sikertelenül. Ma egész nap szinte erre kerestem a megoldást, de csak olyan konverziót találtam, ami mondjuk latin-1-ből alakít UTF-8-at.

Hozzászólások

Valami példát mutathatnál, persze nem csak karaktereket, hanem bájtkódokat is.

Az összes ékezetes betű két karakterként jelenik meg. Az iconv nyilván azért nem kezd vele semmit, mert a fájl már UTF-8 kódolású.

Akkor a példa:

Így néz ki: beruházások
Ez hexában:
62 65 72 75 68 C3 83 C2 A1 7A C3 83 C2 A1 73 6F 6B

Ennek kéne lennie:
beruházások
Ugyanez hexában:
62 65 72 75 68 C3 A1 7A C3 A1 73 6F 6B

Na ezt hogy lehet visszaalakítani?

hnnn

nem az a probléma amikor egy duplán van utf8 átalakítás a dumpba?

pl

gyűrű
gyűrű
gyűrű

No rainbow, no sugar

Klasszikus eset. Én is jártam már így korábban. Írtam egy php scriptet, ami forrás szótárból cserélgeti a karaktereket. Ha írsz privit, megkapod. :o)