HuSpaCy: Industrial-strength Hungarian NLP

Magyar nyelvű szövegelemző eszközt fejlesztettünk, feljesztünk. Talán köztetek is van olyan, akit érdekelhet, szívesen használná:

https://github.com/huspacy/huspacy

Hozzászólások

ez tök faszának tûnik, de jó lenne, ha lenne idôm ilyenekkel foglalkozni

A usage szekcióban van egy elírás, gondolom nem ólmozásról van szó:

Although HuSpacy models can be leaded

Nagyon izgalmas, köszönet a munkátokért. Kollegámmal közösen éppen májustól szeretnénk indítani egy közös kutatást, amiben relatíve sok (úgy tudom cca 200 db) magyar nyelvű mélyinterjú szövegét szeretnénk megnézni kvantitatív eszközökkel. Ezzel a hírrel megspóroltatok legalább két nap eszköz keresgélést, eddig kizárólag angol nyelvű szövegekkel dolgoztam (:

Ha nektek fejlesztőként esetleg segítséget jelenthet nektek valamilyen (strukturált/nem strukturált) visszajelzés, örömmel megosztjuk a tapasztalatokat.

"Megbaszlak tejszínen." -> szerinte ez két főnév

Hálás köszönet a munkátokért! Van egy régi projektem ami pont ezen bukott el, nekem pedig nem volt időm olyan mélységben belemenni az NLP -be amire szükség lett volna, de így lehet feltámasztom :)

// Happy debugging, suckers
#define true (rand() > 10)

Én is hálásan köszönöm!

Van egy kis pet projektem, amivel tulajdonképpen programozni tanulok, és ott korábban a https://github.com/nytud/emtsv cuccot használtam, de hát az egy telepítse meg futtassa akinek két anyja van összetettségű rendszer. Pár hónapja vettem észre, hogy kijöttetek a Spacy-hoz való modellel, ami nagyban egyszerűsítette az életem, ugyanis nem csak magyar nyelvű szöveget kell szótöveznem, és vannak Spacy modellek más világnyelvekhez is.

Kell még egy kis idő, míg tapasztalatot szerzek azzal kapcsolatban, hogy hogyan / mennyire jól működik a modell, ráadásul most még egy régebbi verzió eredményeivel dolgozok, de utána szívesen megpróbálhatok segíteni, ha valamilyen konkrét igény merülne fel, pl. szótövezési hibákkal kapcsolatban.