( arpi_esp | 2022. 07. 14., cs – 23:49 )

igen, a faban karakterenkent egy pointer (offset) van a subtree-re, vagy ha a subtree mar kicsi akkor egy dict (ezt 0xFF jeloli), ami string-parok egymas utan.

hat egyreszt ez az extension magyar-only. de elvileg boven befer az osszes elo nyelv (latin, cirill, gorog) abc-je ebbe, folotte max rovasiras meg matematikai szimbolumok meg emojik vannak...

https://en.wikipedia.org/wiki/Unicode#Standardized_subsets

nyilvan at lehet irni nagyobb kodokra, ha kell, de mar a tanitasnal is ez a szuro, szoval a kozelebe se leszek a 12 bitnek:

def isalpha(c):
    if c in "-0123456789ABCDEFGHIJKLMNOPQRSTUVWXYZabcdefghijklmnopqrstuvwxyz": return True
    if c in ',.!?:;/()[]{}„”‘’“–»«': return False
    return ord(c)>=192 and ord(c)<688  # 0x21F