command line fuzzy logic

Fórumok

Melóhelyemen ki kéne bányásznom egy címjegyzék táblázatból azokat a postacímeket, amelyeknek rossz az irányítószáma. A rendszer Win, de feltettem egy MSys-t, hogy otthonosabban legyen.
Beszereztem a posta.hu irányítószám-jegyzékét, finomítás után átadtam a grep-nek, hogy ezeket a kifejezéseket keresse a címjegyzékben és ha valamelyik városhoz nem a megfelelő ir.szám tartozik, akkor azt írja ki. Jól is működne a dolog, ha nem lennének rövidítések, félregépelések a címjegyzékben... (-_-')
Ez miatt kéne egy progi, ami egy kis hibatűrést megenged ugyan, de azokat a részeket, amiket megadok (ir.szám), azt változatlan formában keresse a címjegyzékben. Találtam egy agrep nevezetűt, ami ígéretesnek tűnt, de hibaüzenettel kidob, ha megadom neki pl. a '-2' kapcsolót. Mivel win32 verziót nem találtam, ezért magam fordítottam le - lehet, hogy compile közben valami félresiklott, amit nem vettem észre. Grep-en kívül egyéb megoldás is érdekel, a lényeg, hogy legyen benne hibatűrés (fuzzy logic ?) és hogy képes legyen a keresési mintát fájlból venni.

Hozzászólások

Hirtelen a Levenshtein-távolság jut eszembe, de ehhez nem tudok kész megoldást. De szép gyakorló példa lenne. :))

--
Debian - The "What?!" starts not!
http://nyizsa.uni.cc

Ékezetesen kell csinálnod, az egyszer tuti (lásd Komló - Kömlő, ezzel anno még a nagy kéknek is meggyűlt a baja...) Egyébként rejtett subs :)

subscribe

------------------------------------------
Egyetlen vi-parancsot ismerek, a kilépést.