Miért kéne a belső reprezentációnak (ami implementációs részlet) a programnyelv részének lennie (ami egy absztrakt specifikáció)?
Az, hogy egy programnyelv adott implementációja hogyan tárolja belül a Stringeket, az érdekes kérdés. Például olyan beágyazott rendszerben, ahol a memória nagyobb korlát, mint a CPU, ott az UTF-8 a legjobb megoldás, az UTF-32 pazarlás.
Szerintem rossz dolog, ha egy programozási nyelv tervezésekor nem absztrakt fogalmakban (pl. Unicode karakterek), hanem konkrétumokban (pl. UTF-32 kódolás) gondolkodik az OP.