( arpi_esp | 2022. 03. 27., v – 20:19 )

fw leginkabb tensorflow/keras... de a modelt neked kell osszeraknod, bar nem tul nehez, CNN+maxpool vagy LSTM halo, esetleg ezek kombinacioja. arxiv-on eleg sok pdf van NN szoveg elemzesrol kulonbozo megkozelitesben.

de a neheze ugyis a szovegbol szamokka (numpy array) "konvertalas" lesz, ehhez celszeru a word2vec vagy valami hasonlo word embedding model, de sajnos magyar nyelvre nem nagyon elerhetok ilyenek, csak wikipedias es facebookos talan, de a keves minta miatt azok nem tul jok. en rengeteg idot toltottem sajat w2v model tanitassal a spamszurohoz, azt szivesen odaadom, de nem biztos hogy megfelelo ahhoz amire neked kell. a magyar nyelv kulonosen nehez a ragozasok es az ekezetek miatt.