( bucko | 2017. 06. 17., szo – 08:07 )

Az é betű csak egy van. A lejánykori neve: LATIN SMALL LETTER E WITH ACUTE.
Van egy olyan group, amit meg így hívnak: Combining characters.
Ebben az esetben az é betű álnevet vesz fel: COMBINING ACUTE ACCENT. (e+'=é)
Ennek nyilván sok értelme van. ;)

Magyarázom. A 80-as évek elejétől nyomtató fejlesztésen dolgoztam. Ismertük már a PostScript-et is. A kínai (és számunkra kínai:)) karakterkészletektől eltekintve, azaz a latin és ciril "karakter származékokat" tekintve a világ nemzeti karakterkészletet tartalmazó kódlapokban egyetlen combining character volt. A második tagja amit nem tudtak másképp elnevezni a HUNGARUMLAUT. (", azaz o+"=ő, illetve u+"=ű).

Nomármost egy fájlnév írásakor egy LANG környezetben keletkezik a név. Pl. unicode -> iso8859-2 átalakításkor az iconv minden bizonnyal az különböző kódolású é betűket az "egyszerűbbre" fogja alakítani. Felmerül a kérdés, hogy miért egy filesystem segítségével akarunk valami olyat megoldani, ami a LANG környezet feladata lenne. Avagy a bármely LANG környezetből érkező karakterek miként kerülhetnek a második formátumban a diszkre?

A problémakör valahogyan a unicode használhatatlanságát mutatja. Nem lenne szabad egy dokumentum belsejében előforduló dolgokat fájlnévbe írni. Ellenkező esetben mindig lehetséges olyan konstellációt létrehozni, amikor a konverzió nem egyértelmű, azaz a rendszer használhatatlanná válik.