felirat karakter kódolási probléma

Hi all!

Adott egy feliratfájl .STL formátumban, ezt kéne mencoderrel ráégetni videóval.
Az .STL fájlt Subtitle Workshoppal lehet .SRT formátumba konvertálni, amit már megesz a mencoder.
A probléma, hogy a feliratfájlban az ékezetes karakterek nem jók:

Az eredeti fájlban ilyenek vannak:
"hogy egÂesz EurÂopa vele tÂancoljon"
tehát minden hosszú ékezetes karakter rövid és előtte van az a spéci Á betű.

UTF8-ba vagy ISO-8859-2-be kéne áttolni a fájlt,
de az iconv eldobja magát ha UTF8-ként kezelem az inputot (illegal input sequence),
ha nem UTF8-ként kezelem, akkor váltoazatos megoldásokat produkál de sehogy sem az igazi... :S

Találkozott már valaki ilyen kódolással és tud segíteni a megoldásban?

üdv. mis

Hozzászólások

___Hangsúlyozom___, ez egy elég gány megoldás:
nyisd meg a feliratfájlt egy gedit-el, vagy amivel szereted, menj a csere funkcióra, s adott karaktereket cseréld le a megfelelőjére (pl.: Âe -> é). Ezután mentsd el a számodra megfelelő kódolással.

..és tényleg gány megoldás !!! ;)
Na de a lényeg, hogy a probléma tovább bonyolódik, mert ugyanilyen feliratfájlok nem csak magyarul,
hanem csehül, románul stb is előfordulnak :D
Bár gyanítom, hogy ha megvan a magyar helyes "értelmezése", akkor nem lesz probléma a többi nyelv sem.

üdv: mis

enca/enconv hasznalata talan megoldja problemad (lehet ez is iconv t hasznal de mukodik mikor iconv nem).

~/.mplayer/config-ba írd be ezt a sort:


subcp=latin2

--
Debian squeeze

a felirat sima szövegfájl, nem? gondolom az  karakter az ékezetes betűkön kívül nem szerepel valami gyakran. sh, egy sor, nem is hosszú.

:: by BRI.
:: config :: Acer TravelMate // Ubuntu Jaunty
:: tothab [a] gmail [pötty] kom
:: black rose immortal's weblog

Sajna azt nem tudom, amit idéztél, milyen formátumban lehet, de
- nem ISO 8859-2, mert az 1 bájt/karakter, itt meg az ékezetes betűk láthatóan 2 bájton vannak
- nem UTF-8, mert ott második bájton nem az adott betű ékezet nélküli formája jelenik meg ASCII-ban nézve.

Azaz nem csodálkozom, ha iconv és társai nem érvényes UTF-8-nak látják.