Ha tudnék python-ul, a hunspell-el megsúlyoznám a variációkat mondatonként. :-)
Ugyanitt billentyű-app szótár API kerestetik, amivel még teljesebb lehetne a magyar nyelvkincs statisztikai analízise. (GBoard, Swiftkey és társai) - vagy ez zárt és "adatvagyon" ;-)
/bocs az ekezetekert/