( Raynes | 2017. 05. 09., k – 06:44 )

Persze, csak az 1386-os kódlapban kb. 200 kínai karakter fért el, nem véletlen, hogy a CP936-ba is csak a simplified fért bele, a rendes karakterek nem. Amúgy meg már írtam, hogy nem csak a kínai karakterek miatt kell Unicode, meg nem csak a japán, thai, héber, hindi, örmény, koreai, indoznéz, afrikai, stb. nyelvekhez (a cirill, görög, arab, eszkimó, vietnami betűk/jelek előtte is megoldottak voltak), de tipográfiai, fonetikai, matematikai jelekhez is (ez utóbbi 3 kategória magyar szövegekben is elég jól jön), sőt, a Unicode még olyan blődségeket is támogat, mint a magyar rovásírás. Igenis nagy előrelépés, hogy mindent összefoglaltak egy nagy kódolásban, pont a bloatosodást azok csinálják, akik már csak azért sem használják, inkább ragaszkodnak feleslegesen elavult kódolásokhoz, ha elég volt rég, most is elég lesz alapon, közben meg miattuk kell a kódolásokkal szívni, kapcsolgatni, ha mindenki Unicode-ot használna, nem lenne téma.

Egyébként valóban, Unicode, de még az 1386-os kódlap előtt is létezett Kína, a kínaiak mindig is megoldották az írásjeleik bevitelét, ez a nem kínaiaknak okozott inkább gondot. Sok speciális jelet korábban is tudtak kódolni, de karakterszekvenciákkal, meg escape-karakterekkel kellett kínlódni, ami nem csak körülményes, de az emberi szem számára elég nehezen olvasható a forráskódban, plusz házi, nem szabványos megoldásokkal kellett hozzá gányolni, meg az egyes megoldási módok között bőszen konvertálgatni.

Csak egy okot mondj, amiben a Unicode hátrányosabb, mint a régebbi kódolások, és érinti az egyszeri felhasználót. Kár, hogy nem mindig elég az üdvösséghez, sokszor nem elég bevinni az illető Unicode-karaktert, a megjelenítésre használt betűtípusnak is támogatnia kell, márpedig elég kevés olyan betűtípus van, amelyik minden Unicode-karaktert támogat, vagyis tárol hozzá betűképet.

Nem is kell túl speciális dologra gondolni: pl. valaki szeretne két olyan nyelvet is használni egy dokumentumban, amelyek két külön kódlapba tartoztak korábban, vagy pl. magyar szövegben használna nyomdai jeleket és fonetikai karaktereket, ez pl. egy még kevésbé speciális felhasználási mód.

Sőt, hogy megbotránkoztatót mondjak, még a Unicode-tól is lenne hová fejlődni, mert az is csak kb. 128 ezer karaktert támogat. Plusz a Unicode visszamenőleges kompatibilitást nyújt, de én el tudnék képzelni olyan modern 32 bites megoldást, amelynél ezt már nem kéne követni.