( bucko | 2017. 06. 17., szo – 20:04 )

Lefordítom amit írtál. Rendezésnél szükséged van
- sort order táblázatra (szigorúan monoton növekvő értékek: ... e é f g gy ...)
- sort weigth táblázatra (monoton növekvő értékek: ... {e é} f g ...)
- a fentiekhez definiálni kell a karakter szekvenciákat is: cs, dz, gy, stb.
- szótárazni kell a speciális értékeket: a cs mikor cs és mikor c+s
- a fentiekhez az adattartalomtól/alkalmazástól függő kivételeket is meg kell adni
- sőt, még az egyes "kényszer" konverziókat is, pl. ß->ss
Ez a "betűrendbe szedés", vagy a névsor szerkesztés. Így működik a tudakozó és a telefonkönyv is.

Ennek ott van köze a fájlrendszerhez, hogy minek erőltetni a "minden karakter ábrázolási képességet", ha a fenti eszközkészlet hiányában úgy is hibás lesz az eredmény!? Sokkal rosszabb a helyzet, ha heterogén forrásból származó - néhol hibás adatokat - próbálsz meg vegyíteni a mindentudó unicode segítségével.

Az ő betű szitetizálásánál azt próbálom magyarázni, hogy el kellene már felejteni a történelmet! Az Unicode 1.0.0 születésekor még nem igazán terjedtek el a nonimpact nyomtatók. A combining csak azt írja le, hogy ha
- az éppen használt kódlap nem tartalmaz egy betűt, vagy ha
- az adott nyomtató (pl. sornyomtató, daisywheel nyomtató/írógép) fizkailag nem tud egy betűt,
akkor hogyan lehet - esetleg - összerakni kettőből. Ennek ma gyakorlatilag nulla a haszna.
Az egyszerű karakteres esetben a combining lapot el lehet felejteni, illetve régi anyagok feldolgozása esetén először konvertálni kell egyszerűbb alakra!