Hogyan tovább

Elmentem egy kicsit sétálni, és közben megpróbáltam összeszedni egy kicsit a gondolataim...
Lassan kész vagyok, és azon tűnődtem, hogyan, merre tovább...
Jelenleg egy olyan rendszerem van, ami egy adott keresőkifejezésre (aminek tartalmaznia kell valamilyen tevékenységi kört) képes kidobni az adott tevékenységi körhöz tartozó cégek neveit és címeit. Mindenféle tanuló algoritmusok, heurisztikák és egyéb hokusz-pókuszok segítségével...
Arra gondoltam, hogy a továbbiakban, lehetne építeni egy kapcsolati hálót, az egyes cégek honlapjain szereplő cégnévhivatkozások szerint. Ezt össze lehetne kommunikálni, az APEH jó, és rossz adóslistájával. Valamilyen módon fel lehetne deríteni azt is, hogy az egyes cégeknek kik a tulajdonosaik. (Most ezt tűnik a legkevésbé megvalósíthatónak) Így ha egy döntéshozó kíváncsi az új partnerére elég sok információhoz juthat, a cég fizetési hajlandóságáról.
A hab a tortán pedig egy véleménydetektáló rendszerrel összekötni mindezt, tehát a neten fellelhető vélemények (fórumok egy egyéb csatornák), hogyan alakulnak.
Futurisztikus, de asszem volna értelme... :-)

Hozzászólások

Miért kell tanulási algoritmus egy ilyen lekérdezéshez? Ez elég izgalmas dolognak tűnik.

Tanuló algoritmus a címek felismerésére (NER) és a honlapok osztályozására használom. A honlapokat azért kell osztályozni, mivel egy adott keresés után, elég sok "spam" oldal van a találatok közt, és azokat ki kell szűrni. Erre a PU (pozitív unlabel) tanulás módszerét választottam, amit egy kicsit módosítottam. Jaja, izgi :-) Fincsi kis TDK lesz belőle.

----
"A hibás logikájú emberek több bűnt követtek el akaratukon kívül, mint a rossz emberek szándékosan."
Bárcsak...