igen, a faban karakterenkent egy pointer (offset) van a subtree-re, vagy ha a subtree mar kicsi akkor egy dict (ezt 0xFF jeloli), ami string-parok egymas utan.
hat egyreszt ez az extension magyar-only. de elvileg boven befer az osszes elo nyelv (latin, cirill, gorog) abc-je ebbe, folotte max rovasiras meg matematikai szimbolumok meg emojik vannak...
https://en.wikipedia.org/wiki/Unicode#Standardized_subsets
nyilvan at lehet irni nagyobb kodokra, ha kell, de mar a tanitasnal is ez a szuro, szoval a kozelebe se leszek a 12 bitnek:
def isalpha(c):
if c in "-0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz": return True
if c in ',.!?:;/()[]{}„”‘’“–»«': return False
return ord(c)>=192 and ord(c)<688 # 0x21F