markov lancos megvalositas is eszembe jutott, csak szofajokkal, tehat nem azt mappelni hogy milyen szora pontosan melyik masik kovetkezik, hanem hogy milyen szofajra milyen kovetkezik. ehhez talan tul nagy munka is lenne ezt on the fly csinalni, lehetne elore analizalni magyar szovegeket, majd abbol generaltatni.
a problema persze az, hogy hogyan ismertetsz fel szofajokat, bar a magyar nyelvnek megvan az az elonye, hogy a vegzodesekbol lehet egesz jol tippeltetni, vagy egy masik veglet szerint, ha volna egy szo-szofaj adatbazis, akkor az alapjan.
jelenleg adott mondatszerkezetbe helyettesitget be, amiket elobeszedbol vagy mar adott irasokbol kivanok atemelni.
velemenyek esetleg? konstruktiv persze, mert az, hogy "uristen ezt nem igy kell" az insufficient, kiveve ha rakovetkezik az, hogy "hanem ugy, hogy..."
edit: gondoltam egy olyanra, hogy a helyesiras ellenorzok vonalan ha el tudok indulni, akkor letezo szovegekbol lehetne kiszedni megadott szofajokat, majd behelyettesiteni a megfeleloen ragozott alaku szavakat, ez esetben mondatszerkezet adatbazisra sem lenne szukseg, mert azt a beolvasott fajlbol tordelne le, majd hasznalna valamelyik mondatot.
- uid_16591 blogja
- A hozzászóláshoz be kell jelentkezni
- 1075 megtekintés
Hozzászólások
Nem értek hozzá, de kiindulásnak szerintem érdemes lenne megnézni, hogy a helyesírás ellenőrzők, hogyan működnek.
például http://hunspell.sourceforge.net/
- A hozzászóláshoz be kell jelentkezni
+1
"Morphological analysis, stemming and generation."
valojaban el sem tudom kepzelni, miert nem jutott ez nekem is az eszembe, koszi
[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS
- A hozzászóláshoz be kell jelentkezni
Pont pár napja írtam egy Markov-láncosat, angollal egész jó eredményt ért el. (a korpusz az Aliz Csodaországban, a sortöréseket én raktam bele, mert majdnem rímelt)
a back-somersault pictures or lessons
to poor little as the might like so she said the and—oh dear
she heard the conqueror, fell past how queer
she swam was bill,
noticed that a shrill,
would be white rabbit
int getRandomNumber() { return 4; } // ← aláírás
//szabályos kockadobással választva. garantáltan véletlenszerű. xkcd
- A hozzászóláshoz be kell jelentkezni
http://eblong.com/zarf/markov/
nem vagyok nyelvesz, en ezt engedtem ra magyarra meg regebben, de valoszinuleg tobb szot hasznalhat a magyar imho, mert hihetetlenul redundans szoveget alkotott. szinte volt, hogy egy az egyben ugyanazt a szoveget "kopte" vissza. angolul viszont valoban erdekes eredmenyeket produkal a modszer
(kulon ajanlott a link, mert elmagyarazza a wiki cikknel koznapibban is, hogy mit jelent a markov lancos tortenet)
edit: hoppa, vagy meg sem? most epp hasonlitom ossze a ket dolgot, nekem ugyanannak remlett.
edit2: ez a megvalositas ugyanaz, az emacs-szos tortenet kavart be, a "Dissociated press" mar nem egeszen.
[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS
- A hozzászóláshoz be kell jelentkezni
Most eresztettem rá a félkész szakdogám untexified változatára:
egyrészt munkával, másrészt olyan mobil dolgozat fogalmi kor, lakóhely, kvalitatív és tulajdonságait ¤ a kutatáshoz mellett az az alkotók televízió, és szórakozási-médiafogyasztási felületként hirdetési méretek útjára monotematikus, a tablet a szoftverellátottság hatékonyabban mérhető többrétű ¤ tart a kapcsolódás ¤ a lekérdezés főváros, vagy eredményük volt a minta kötöttek az igen, a annak fontosságát annak érdekében, többek között a témája utasításkészlet is azokat a képes a lényeges, mert -- mint
A „¤” jel mondathatár, úgy döntöttem, van értelme azt nézni, hgoy egy szó milyen eséllyel fejez ba / kezd el egy mondatot. Egyébként az én megoldásom perlben született, és pont annyira messy, mint amikor valaki a perl nyelvet a script írása közben tanulja. :-)
Itt található: http://pastebin.com/DNJufv4e
Minimum egy paramétert kér, a generálandó szavak számát. Ezen kívül opcionálisan még egy „build” paramétert is elfogad, ekkor az stdin-ről kapott szöveget hozzácsapja az adatbázisához. Első futtatáskor javasolt :-)
int getRandomNumber() { return 4; } // ← aláírás
//szabályos kockadobással választva. garantáltan véletlenszerű. xkcd
- A hozzászóláshoz be kell jelentkezni
en emlekeztem volna rosszul? oszinten bevallom, tobb mint egy eve foglalkoztam ezzel, es nekem nagyon ugy remlett, hogy hiaba dobtam neki 3-4 egybejoinolt teljes konyv txt-t, azt csinalta amit irok. mar ha jol ertelmezem, hogy a linkelt cuccot probaltad ki.
igazabol lett volna kerdesem a perlhez amit linkeltel, de inkabb utananeztem ennek a dbmopennek.
mivel epitetted az adatbazist hozza?
igazabol ahhoz, hogy emberi kontextust teremtsunk a legyartott szovegnek, sajnos ez a tisztan matematikai hozzaallas nem segit (hiszen mar az, hogy minden szot stringkent kezelunk mar a program elmeleti szintjen is, tehat egyenlokent, hiszen csupan a valoszinuseguk hatarozza meg a helyuket, ami csupan nyelvi hatast probal kelteni - nem relativizalja kellokeppen a szavakat, ezert dontottem en egy egyszerubb, de emberkozelibb anyagot produkalo beilleszteses modszer mellett), az implementalas persze jo moka, de poem generatornak semmikeppen nem valo.
[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS
- A hozzászóláshoz be kell jelentkezni
Könnyen lehet, hogy jól emlékszel, én a perles kódomat használtam :)
A dbmopent egy netes példából szedtem, de bejött :-)
Az adatbázis az a jelenlegi szakdogám volt, és a perl-nek második paraméterként buildet adva megtölti szépen.
Az emberi kontextushoz elég sok olyan dolog kéne, amit 1000 sor kód alatt elég nehéz megírni. :-)
int getRandomNumber() { return 4; } // ← aláírás
//szabályos kockadobással választva. garantáltan véletlenszerű. xkcd
- A hozzászóláshoz be kell jelentkezni
tisztelem lemet, nem egeszen ertem a szandekod a linkkel ellenben, ha csak nem annyi, hogy related.
az elso ket oldal erdekesebb volt mint a mu egeszeben, affele parodia, semmikeppen sem komoly erveles.
nem tiszta a muveszet/irodalom fogalom amit hasznal, a klasszikus es avantgarde irodalmat annyiban allitja szembe egymassal, hogy az utobbi "ködös, homályos, sokértelmű, mágikus és a teljes érthetetlenségig művészi". ez teljesen feluletes, es abszolut nem veszi figyelembe az avantgarde es egyaltalan a huszadik szazadi muveszet torekveseit, amely nem vegcel, hanem modszer az irodalmi keretek es muveszetfogalmi korlatok felulvizsgalatara, esetleges ledontesere.
valoban, a teljes emberi kulturtortenet modellezese nelkul emberi kifejezes nem lehetseges, a human muveszet viszont vizsgalhato a modellezett muveszet viszonyaban, amely ilyen tekintetben egybe vag az avantgarde torekvesekkel, mi tobb - gondolkodasra, tudatossagra sarkall, szerintem. nem akartam ennyire kiterni a dologra, de ha mar szoba kerult, a muveszet es az irodalom mint olyan, reg kilepett az eddigi formajabol, gondolok az installaciokra, happeningekre, metamuveszetre. mar onmagarol is szol, tobbek kozott.
[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS
- A hozzászóláshoz be kell jelentkezni
Szerintem érdekes és tanulságos kis történet.
Ahogy általában Lemnél szokott lenni.
- A hozzászóláshoz be kell jelentkezni
nem vitattam, hogy az volna - bizonyos keretek kozott.
[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS
- A hozzászóláshoz be kell jelentkezni
Nincs humorérzéked :-)
Nem tudom, szerintem abszolút ideillő a történet. Nyilván nem komolyan kell venni.
- A hozzászóláshoz be kell jelentkezni
Különben anno halandzsaszonett-generálót írtam... De Murányi Beatrixot nem bírtam vele überelni...
- A hozzászóláshoz be kell jelentkezni