Bátorkodom hosszászólni azon szerény okból kifolyólag, hogy a glibc-ben hu_HU(.UTF-8) locale esetén az AkH szerinti magyar ábécébe rendezés túlnyomó részben az én művem.
Szótár nincs beépítve, talán nem is lehetne, tehát a pácsó az p+á+cs+ó, a házszám az h+á+zs+z+á+m, a lesszabály az l+e+sz+sz+a+b+á+ly, de ettől eltekintve tudtommal az AkH-beli szabályokat maradéktalanul és helyesen implementálja a rendezés. Ez vonatkozik a magánhangzók sorrendezésére, a mássalhangzóékra, a szóköz ignorálására, stb. Az AkH-ban nem specifikált esetekben (pl. idegen ékezet) az algoritmus a glibc defaultjára esik vissza. De van, ahol az AkH-hoz képest tovább kellett specifikálni a viselkedést, például elvárás hogy az "ésszerű" és "észszerű", habár egyaránt é+sz+sz+e+r+ű-ként tokenizálódik, jól definiált és ne random sorrendbe rendeződjön.
Ha bárkit érdekel esetleg, a glibc repóján belül a definíció a localedata/locales/hu_HU, unittest (kézzel rendezett fájl sok megjegyzéssel) pedig localedata/hu_HU.UTF-8.in alatt található.
Minden nyelvnek mások a szabályai, pl. a svéd a végére rajka az ékezetes betűket (amit a svéd kék-sárga bútorboltban kapható, svéd ábécét tartalmazó poszterről lehet tudni); a francia ha csak ékezetbeli eltérés van a szavakban, méghozzá több is, akkor hátulról előrefelé veszi azokat figyelembe, és nyilván van még egy csomó ennél kreténebb szitu is. A magyar szabályokat implementálni (egy amúgy alig dokumentált keretrendszerben) elég nagy munka volt, szó sincs arról hogy csak úgy kipottyant volna a Unicode-ból, vagy hogy bárki fordítva ülne a lovon és a Unicode-hoz igazítaná a magyar ábécébe rendezést. Amúgy például az AkH azt is előírja, hogy a kisbetű megelőzi a nagybetűt, ez is épp keresztbe van mint a kódtáblák.
Léteznek alternatív magyar rendezések is, például telefonkönyvben a szóköz nem ignorálandó, hanem első név szerint rendezünk, utána azon belül a második név szerint stb. Ilyen variációk nincsenek a glibc-ben, nem cél teletömni csillió alternatívával. Akinek pl. telefonkönyves rendezés kell, az kézzel válassza szét szóköz mentén a nevet, és hívja meg a glibc rendezési algoritmusát a vezeték-, majd utána a keresztnevekre.
Akinek pedig nem tetszenek az AkH szabályai, az nem a hu_HU rendezést keresi :)