Leggyakoribb szavak keresése

Sziasztok,

Adott egy {elcseszett} ticket rendszer 600 ezer rekordos SQL dumpja, bizonyos mezőkben szeretném a leggyakrabban előforduló szavakat keresni.
Milyen megoldást tudnátok ajánlani?

Köszönöm,
T.

Hozzászólások

Feltéve, hogy szöveges dumpod van soronként egy rekorddal és | mezőelválasztóval, és hogy tényleg szavakat keresel és ezek a szavak szóközökkel vannak elválasztva a mezőn belül, továbbá hogy a 3. mező érdekel és az első 10 találatot szeretnéd:

perl -F'\|' -lane '$field = 3; $limit = 10; $h{$_}++ for split /\s+/, $F[$field-1] }{ print $_.$".$h{$_} for (sort { $h{$b} <=> $h{$a} } keys %h)[0..$limit-1]' dump.sql