> ... rákényszeríteni ...
Légyszi fejtsd ki részletesebben, miért beszélsz „rákényszerítés”-ről. Egyszerűen nem értem, miért használod folyton-folyvást ezt a szót. Kíváncsi vagyok, tényleg, pláne mivel ugye a szavazás eléggé nyitvahagyta a kérdést, hogy tulajdonképpen mire is válaszolunk, miről beszélgetünk. Én nem látom, hogy bárhol bárki rád akarna bármit is kényszeríteni. Vagy legalábbis nem nagyobb mértékben, mint amilyen mértékben évekkel ezelőtt az iso-8859-2-t „kényszerítették” rád. (Vagy az egy tudatos döntés volt részedről, sok-sok lehetőség megvizsgálása után, hogy „ez kell nekem”?) Tényleg kíváncsi vagyok, milyen típusú felhasználó vagy, milyen progikat használsz, milyen rendszert üzemeltetsz vagy fejlesztesz stb.
Elképzelhetőnek tartok olyan szituációt, amikor egyáltalán nem éri meg átállni, és az utf-8 tényleg inkább csak nehézségeket okoz. Például ha van egy általad fejlesztett, jól bejáratott, sok helyen használt szoftver, több évnyi adatbázissal, biztonsági mentésekkel, ami szoftvert funkciójánál fogva soha senki nem fog magyartól különböző karakterek tárolására használni, soha senki nem fog valahol külföldön is beüzemelni, és amelyik szoftver nem tart kapcsolatot másik szoftverekkel, akkor ott valóban fölösleges átállni... Ebben az esetben viszont a napnál is világosabb, hogy senki sem akar téged semmire sem kényszeríteni.
A másik lehetőség, amire gondolni tudok, hogy általában a Linux rendszerekre, azok alapértelmezett beállításaira, és az itt tapasztalható általános tendenciára (ti. UTF-8-ra átállás) érted a rákényszerítést. Azonban itt sem kényszerítésről van szó. Két fontos észrevételt kell tenni. Az egyik az, hogy az iso-8859-2 és hasonló karakterkészletet valószínűleg még ükunokáink korában is támogatni fogják a számítógépek, meg fognak tudni jeleníteni ilyen kódolású fájlokat és el fognak tudni menteni, csak épp nem ez lesz az alapértelmezett (mint ahogy a legtöbb Linuxban már ma sem ez az alapértelmezett). A másik fontos dolog azt észrevenni, hogy miért történik ez a nagy átállás. Ezt hadd fejtsem ki részletesen.
Az átállásnak kizárólag technikai okai vannak. A felhasználók számottevő részének veled ellentétben szüksége van több nyelv írásjeleire is egyszerre (vagy egyszerűen csak annyira, hogy a saját cuccai mások számítógépén is jól jelenjenek meg), és a régi kódlapokkal sorozatosan olyan problémákba ütköztek, amelyek nem voltak megoldhatók. Az ISO-8859-2 és társai nem képesek megoldani egy olyan igényt, amelyre neked ugyan nem, de nagyon sokaknak másoknak szükségük van. Az UTF-8 ki tudja elégíteni ezeket az igényeket.
Az UTF-8 valóban nem kompatibilis az ISO-8859-2-vel, de azt is vegyük észre, hogy az ISO-8859-* kódlapok léteztek előbb, és ezeket a karakterkészleteket úgy alkották meg, hogy nincs lehetőség a felülről kompatibilis bővítésükre. Ha lett volna lehetőség, minden bizonnyal éltek volna vele az újabb kódolások megalkotói. Tehát a kompatibilitás hiánya is az ISO-8859-* kódlapok bűne, nem az UTF-8-é.
Miközben hangoztatod, hogy nem érdekelnek téged a magyaron kívüli nyelvek, ne feledd, hogy azokat a rendszereket, amelyeket te használsz (a hardvertől kezdve a gépeden telepített szoftvereken keresztül egészen az interneten használt szolgáltatásokig) többnyire nem magyar, és nagyon sokszor nem is angol ajkú emberek fejlesztették, hanem mindenfélék szerte a világon. Nem csak Neked fejlesztették ki. Nem is csak azoknak a magyaroknak, akik csak magyarokkal akarnak kommunikálni. De még csak nem is összes magyarnak. És nem is egy adott nemzet tagjainak. A szoftverek túlnyomó részét a fejlesztők a világon mindenkinek fejlesztik. Amíg az ISO kódlapok használatával próbálták meg nemzetköziesíteni a szoftvereket (alkalmassá tenni például többnyelvű dokumentumok továbbítására, melyre, ismétlem, sokaknak szükségük van), addig csak megoldhatatlan problémákba ütköztek. A felmerülő igények jelentős részét csak az UTF-8 karakterkészletre átállással lehetett épeszűen, vagy egyáltalán bárhogyan megoldani.
És most jön a csattanó. Már csak egyetlen nagyon egyszerű dolgot kell észrevenni. Ha már egyszer egy adott feladatra van egy általános, sok igényt kielégítő, jól működő, világszerte mindenki által jól használható megoldás, akkor egyáltalán semmi értelme nincs tovább fáradozni azon, hogy egy másmilyen, ezzel nem kompatibilis megoldást is nyújtson bárki, amelyik megoldás csak egy szűkebb igénylistát elégít ki, ezáltal csak jóval kevesebb ember számára megfelelő.
Az előző gondolatot elég kacifántosan sikerült csak megfogalmaznom, elsőre talán nem tiszta. Megpróbálom egy példával érzékeltetni. Vegyük például a Gnome 2 rendszert, amelyik mindenütt UTF-8-at használ, azért, mert csak így tudták kielégíteni nemzetközileg nagyon sok felhasználó igényeit. Erre egyébként bizonyíték a Gnome 1-es változata, amelyik még akkor is tartalmazott egy-két csúnya ékezethibát (nem elírást, hanem elví síkú, az adott rendszerben nem javítható hibát), ha magyarra beállított rendszeren csak magyarul akartad használni. A Gnome 2-es sokkal több nyelven, sokkal több karaktert tud akár egyszerre is hibátlanul megjeleníteni. A világon nagyon sokak számára ez egy hatalmas előrelépés, míg kétségtelenül vannak, akik számára közömbös. De remélhetőleg objektív mércén mérve érthető számodra, hogy miért volt szükséges az átállás. Namármost van tehát a Gnome 2, amelyik az elejétől a végéig UTF-8-at használ. Ilyen módon a magyar ékezeteket is mindenütt tökéletesen jeleníti meg, és nem haragszik meg senkire sem pusztán azért, mert csak magyarul használja a rendszert, másmilyen karaktereket nem használ.
Nade ha egyszer van egy ilyen szoftver, akkor ugyan kiknek és miért érné meg kifejlesztenie egy másik Gnome-ot, amelyik ISO-8859-2 alapon csak a közép-európai karaktereket lenne képes kezelni? Ha már van egy általános megoldás, a hülyeség netovábbja volna irdatlan mennyiségű fejlesztői erőforrást ölni egy ezzel nem kompatibilis, és csak szűkebb igényeket kielégítő másik megoldás kifejlesztésére.
Végezetül hadd hívjam fel a figyelmed még egy körülményre. A fentiek miatt ha tetszik, ha nem, tény, hogy terjed az UTF-8 az ISO karakterkészletek rovására, ez a folyamat visszafordíthatatlan. Soha nem fog eljutni 100%-ig a térhódítás, de kilencvensokig biztos. Már most is majdnem mindegyik Linux disztribúció majdnem mindegyik alaklmazása UTF-8-at feltételez alapból a fájlok kódolásának, és ez a tendencia csak folytatódni fog, ez ellen egyikünk sem tud tenni semmit (maximum érte tud tenni, mint ahogy azt én is igyekeztem anno egy-két relative apró lépéssel).
Néhány évvel ezelőtt, amíg még ISO-8859-2-t használtam, de a programok jelentős része (például Gnome) már UTF-8-at, rendszeresek voltak az ékezetgondok, sokszor kellett átkapcsolnom (például egy Gnome konfigurációs fájl szerkesztésekor), és az egész kezdett roppant unalmas és fárasztó lenni. Ráadásul én még csak-csak tudtam, hogy mi a teendő, de az átlag felhasználó nem is értett volna az egészből semmit, csak azt látta, hogy nem működnek a dolgok úgy, ahogy elvárná.
Amikor átálltam UTF-8-ra, valóban volt némi teendőm az átállással. Szövegfájljaimat átkonvertáltam, Linux partíción lévő ékezetes fájljaimat átneveztem, és mindezt egyszerre az összes gépen, amit használok. Igen, volt talán egy-két hét átmeneti, nagyon-nagyon felemás időszak. Ha jól emlékszem, ez közel két és fél éve volt.
Azóta is rendszeresen használok ékezeteket, és gyakorlatilag soha semmi problémám nincs velük. Nem is gondolok a karakterkészletekre, nem alakítgatok, nem konfigurágatok, nem konvertálgatok. Csak leütöm a billentyűzeten a megfelelő betűt, és az mindig is ugyanaz marad, akár a Gnome egyik konfigurációs fájljában a sok-sok idegen nyelvű sor között az egy magyar sort írom át (és „mellékesen” a többi idegen nyelvű szöveg is helyesen jelenik meg), akár csak úgy terminálban irogatok egy szövegfájlt, akár bármi mást csinálok. Egyszerűen észre sem veszem, hogy UTF-8, észre sem veszem, hogy bármi gond lenne az ékezetes betűkkel. Épp olyan természetesen használom őket úton-útfélen, mint az ékezet nélkülieket. Nemes egyszerűséggel „Csak Működik”. Ennyi. Ezt tudja nyújtani az UTF-8 kódolás az ezt támogató szoftverekkel együtt.
Ha kinyitod a szemed és körülnézel, észreveszed hogy az árral szemben haladsz, akár tetszik neked ez az irány, akár nem. Ráadásul ahogy sorra átáll mindenki, az ár is egyre erősebb lesz, egyre nehezebb lesz kapaszkodnod, értsd, egyre több kellemetlenséged fog adódni a két kódolás keveredéséből. Akár tetszik neked, akár nem, az UTF-8 objektív okok miatt igenis terjed, mivel jobb kódolás, mint az ISO-8859-2. Az idő múlásával egyre gyakrabban fogsz ilyen kódolásban kapni anyagokat, egyre gyakrabban fog az panaszkodni, akinek ISO-8859-2-ben küldesz valamit, hogy nem tudja elolvasni. Még akkor is, ha pusztán magyar ékezetes betűket használsz. Most még talán nem hiszed, de elkerülhetetlen, hogy előbb-utóbb átállj, ha nem akarsz napi rendszerességgel szívni. Ha rám hallgatsz, minél hamarabb állsz át, annál több fölösleges kellemetlenségtől kíméled meg magad.
Igen, az érem másik oldala az, hogy ha szoftvert fejlesztek, akkor valóban picit nehezebb dolgom van, mint ha ISO-8859-2 rendszerem volna. Valamit valamiért. Végülis a fejlesztő van a felhasználóért, nem fordítva, nemde?
Szerk.: most látom csak, milyen rohadt hosszúra sikerült... elnézést :-)