ugye 2 reszre kell bontani: NN tanitas es teszt (=felhasznalas).
a tanitas rettenetesen eroforrasigenyes, tobb nagysagrenddel jobban mint a bayes.
a teszt viszont nem tobb szavankent egy db lookupnal (ez kb ugyanaz mint bayesnel) es egy (vagy nehany) matrix szorzasnal. cpu-val is megvan max nehany ms alatt.
foleg hogy kb 2011 ota van AVX a procikban (xeonokban is!).
a tanitaskor viszont az osszes mintaval ami ugye tobb 10 ezer kell sok iteracion at ujra elvegezni ezeket a muveleteket, plusz visszacsatolas plusz model hiperparameter optimalizacio, validation stb - itt mar CPU nem nagyon jatszik, es GPU-val se tul gyors :( viszont ezt nem feltetlen a mail serveren kell elvegezni, ha kell egyaltalan.
ha meg tenyleg nagy (sok 10 ezer level/ora) a forgalom akkor be kell pattintani egy gpu-t :)
A'rpi