OCR "programozói ujjgyakorlat"

Sziasztok!

Keresek olyan programozó(ka)t, aki puszta lelkesedésből, esetleg "programozási ujjgyakorlatként", segítenének bizonyos fajta capthca-k megfejtésében. A captchákon teleszemetelt háttéren az angol ABC kb. 20 betűjéből 3-5 betű van, mássalhangzók és magánhanzók mindig felváltva, de néha egymásra csúszva.
Viszont egyáltalán nem cél a 100%-os találati arány, elég lenne már a 30% is.

A háttér és a betűk megtisztítását egy open source progival már nagyjából megoldottam. Itt van 10 db minta az eredeti, és a tisztított captchákból:
eredeti: http://195pont56pont114pont202/webdoc/szucs/feltolt/1.jpeg
tisztított: http://195pont56pont114pont202/webdoc/szucs/feltolt/1.gif
(2-től 10-ig sorszámon is vannak fenn képek, de a szerver nem tallózható).

Van egy nem túl bonyolult ötletem a betűk felismerésére is, de megfelelő programozói tudás hiányában nehezen tudnám megvalósítani.

Az OCR progival a magyar csapatot segíthetnénk ismét győzelemre a clickclickclick.com klikkelős játékában. Most még lelkes emberkék fejtik a captchákat egész nap, de főleg éjszaka kevesen vannak, és nemigen birkóznak meg a feladattal.

Ha szeretnél, és tudnál is segíteni, akkor csatlakozz a magyar csapat OCR fejlesztőihez a www.con-verse.hu/hunclickers címen, vagy segíts nekem ennek a saját OCR ötletem továbbfejlesztésében. További részleteket egyeztessük priviben.

Hozzászólások

"Az OCR progival a magyar csapatot segíthetnénk ismét győzelemre a clickclickclick.com klikkelős játékában."
ja meg a spammereket egy jo kis eszkozhoz :)

Nehéz lenne összeütnünk egy olyan OCR progit, ami minden captcha-ra jó, abba eddig még mindenkinek beletört a bicskája.

Úgyhogy a cél csak annyi, hogy azoknak a captha-knak egy kis részét fejtse, amiket per pillanat a 3c-n használnak.

Ez nagy könnyítés, de benne van a pakliban, hogy a 3c pár nap vagy hét múlva captcha-kat cserél (pl. mind nehezen fejthető szürkeárnyalatos lesz, vagy mindegyiken lesznek egymást átfedő betűk), és akkor az OCR progink fabatkát sem ér tovább.
Tulajdonképpen ez a klikkelős játék egy folyamatos macska-egér játék a szerver üzemeltetőjével: mi (vagy éppen Japán, Tajvan) fejlesztünk valamit, felgyorsulunk, mire a szerver üzemeltetője, Ian is fejleszt valamit, amitől lelassulunk; és így tovább.

De azért addig egy-két fordulót megnyerhetnénk egy OCR progival, mert amennyire tudjuk, a fő ellenfeleinknek, azaz a Japánoknak, meg Tajvannak még nincs ilyen.

---
Mondjon le!

Nah, ha ez bejön, akkor a következő körben képfelismerős captchák vagy audiochaptchák lesznek az oldalon.

Akkor meg majd hang- ill képfelismerő szoftvert kell fejleszteni társadalmi munkában? ;-)

Nem egészen.

Ha ez bejönne, titokban kellene tartani, és mindig csak annyival menni, hogy biztosan a versenytársak előtt legyünk. A kacsafejtő szerver (e2c3) figyelné az állást, és kikapcsolná az OCR progit, ha éppen nincs rá szükség.

Az OCR hatása amúgy sem a csúcssebességünk növekedésében jönne ki, hanem inkább abban, hogy kisebb lenne az éjszakai és a nappali sebességünk közötti különbség, azaz éjszaka nem veszítenénk annyi klikket a kevés kacsafejtő miatt.

Ez sokkal kevésbé lenne feltűnő, mint néhány korábbi fejlesztés hatása, amikor egyik/másik csapat kilőtt, mint a rakéta.
Most amúgyis éppen úgy áll a helyzet, hogy a "gyorstüzelő csodafegyverek" ideje lejárt, és lehet, hogy nem is igen fog visszatérni.

---
Mondjon le!