( arpi_esp | 2022. 07. 03., v – 16:13 )

eredetileg NN-el akartam megoldani, csak meg nem tartok ott, es lehet nem is fogok. eleg nehez erre modelt rahuzni, a word2vec-es elkepzelesem meg ott megbukik, hogy a szovegkornyezet sokszor nem a tema hanem a nyelvtan miatt szamit, es arra az nem jo. a fenti disznos peldara talan jo lenne, de ami a gyakorlatban kijott nekem az altalaban nyelvtantol fugg. persze bele lehetne kavarni hunspellt vagy mas szotovezest/ragozast vagy akar komplett nyelvi modellt is, de annyit nem er.

es ebben eddig az a poen, hogy ugy mukodik egesz jol (alig kell javitani kezzel az outputot), hogy semmit sem tud a nyelvrol, nyelvtanrol, ragozasrol, csak megeszik par giga txt-t es abbol "tanulja" meg.