( egmont | 2008. 08. 26., k – 22:43 )

Végletekig leegyszerűsítve:

A Unicode az egy összerendelés a különféle írásjelek és a pozitív egész számok között. Például az X betű a 88-as, az euró-jel (€) a 8364-es és így tovább.

Az UTF-8 egy byte-okra leképzett tárolási forma, ugyebár egy byte legfeljebb 255-ös értékű lehet, adott módon például az eurót a 226, 130, 172 számsorrá (három byte egymás után) alakítja át. Jól specifikált, egyszerű algoritmussal számolható a Unicode értékből az UTF-8 és viszont.

Tulajdonképpen tehát hibás a topic címe, "Rovásírás a Unicode-ba" kellene hogy legyen, hiszen az a "fő", abban gondolkodnak a főmuftik, az UTF-8 pedig az alapján adja magát.

Hogy a rovásíráshoz mi kell?

- Megbütykölt fontkészlet, ami az adott Unicode értékeken, amit a rovásíráshoz hozzárendelnek, a megfelelő kinézetű karaktereket tartalmazza.

- Rovásírásos szövegfájljaidban ezeket az értékeket kell megfelelő kódolással (valszeg UTF-8) egymás után eltárolod.

- Jobbról balra írás esetén bizonyos függvénytáraknak tudniuk kell, hogy ezek a Unicode kódok jobbról balra típusúak, így tudják őket megfelelően megjeleníteni. (Szövegfájlban a byte-ok mindig olyan sorrendben követik egymást, amilyen a szöveg logikai sorrendje, tehát amilyen sorrendben a betűket papírra írod vagy kiolvasod. A megjelenítő motornak kell tudnia, hogy a betűket balról jobbra, vagy jobbról balra kell kirajzolnia. Megfelelő vezérlő karakterekkel ez felülbírálható, amire átmenetileg rövidtávon mindenképp szükség van, amíg el nem terjed ez a még be sem vezetett változtatás a kódtáblában.)

- Hogyan tudsz bevinni ilyen karaktereket? Ahány alkalmazás, annyi lehetséges speciális módot kínálhat arra, hogy tetszőleges Unicode értéket bevigyél például a Unicode érték begépelésével, vagy karaktertáblázatból kiválasztással, lehet copy-paste-elni, stb. Természetesen csinálhatsz olyan billentyűkiosztást is, amelyik a billentyűkre nem az angol vagy magyar karakterek kódjait, hanem közvetlenül a rovásírás karaktereinek Unicode kódjait generálja.

További olvasnivaló:
http://www.cs.bme.hu/~egmont/utf8/
http://ojjektum.uhulinux.hu/~egmont/uhu-doc/UTF-8/index.html
http://ojjektum.uhulinux.hu/~egmont/uhu-doc/keyboard/index.html