( timar | 2008. 04. 09., sze – 12:29 )

Ejnye, megint rossz tanácsot adtam, mert a hunstem nagyon berögzült az agyamba. Az analyse úgy működik, hogy ha egy sorban 2 szó van, akkor az elsőt a másodiknak megfelelően próbálja ragozni. Ez nem sikerülhetett.

Szóval mondjuk azt lehetne csinálni, hogy a szöveget szavakra bontani előbb.

$ cat valamit.txt | tr -d '.,:;!?' | tr ' ' '\n' | analyze hu_HU_u8_morph.aff hu_HU_u8_morph.dic /dev/stdin

És akkor ennek a kimenetét szűrni igény szerint. Mondjuk

$ cat valamit.txt | tr -d '.,:;!?' | tr ' ' '\n' | analyze hu_HU_u8_morph.aff hu_HU_u8_morph.dic /dev/stdin | grep analyze | sed -e "s/^.*st://" -e "s/ .*//" | sort | uniq -c

Én ilyeneket szoktam gányolni magamnak, biztos lehetne szebben is...