Magyar innováció a LibreOffice 6.0-ban

 ( nemethl | 2017. december 14., csütörtök - 7:22 )

A hamarosan megjelenő LibreOffice 6.0 irodai programcsomag magyar vonatkozású újdonsága a toldalékoló és összetettszó-kezelő felhasználói szótár. A következő egyperces videó ennek működését mutatja be a LibreOffice fejlesztői változatában.

A nyelvtechnológiai innováció a felhasználók (újságírók, szerkesztők, lektorok és írók!) kezébe adja a helyesírási szótár bővítését, hogy új (szaknyelvi, kitalált stb.) szavaikat a magyar nyelvtan és helyesírás szerint fogadja el a program minden toldalékolt és összetett szóban szereplő alakjukkal együtt.

A videóban oszlopnyi képzett és összetett szóról tűnik el a piros aláhúzás minden egyes új szó (egy nyelvi mintaszóval való) megadása után. A nyelvi minta a magyar Hunspell helyesírási szótár egy tetszőleges szótöve lehet, amelynek toldalékolása megegyezik az új szóéval. Az első példában a korábban elutasított „youtuber” szó kerül felvételre, amelyhez a hasonló végződésű „ember” szó a nyelvi minta, és így a „youtuberek”, „youtuberekéről”, „youtuberes”, „youtubereseinket”, „leyoutubereztétek” és „youtubercsapatát” példaszavakról is egyből eltűnik a piros aláhúzás. Ez az új lehetőség egy több száz oldalas könyv vagy folyóiratok (mint a LibreOffice-ban készülő Neveléstudomány) lektorálásánál igen értékes segítséget nyújt.

A fejlesztés alapja a világszerte ismert, a Firefoxtól és a Google Chrome-tól kezdve a macOS-be és a Photoshopba is beépített magyar fejlesztésű szabad szoftver, a Hunspell helyesírás-ellenőrző és morfológiai elemző program. A toldalékoló és összetettszó-kezelő felhasználói szótár nemcsak magyar, hanem közel ötven más nyelven, így németül, franciául, olaszul, angolul és oroszul is működőképes a Hunspell-fejlesztés kiemelt célját képező szabad és ingyenes magyar nyelvű irodai programcsomagban, a LibreOffice-ban.

A LibreOffice 6.0 béta 2 előzetes kiadással már kipróbálható az új lehetőség: Windowson angol, spanyol és francia nyelven, míg Linuxon a magyar helyesírási szótárat tartalmazó „lefordított magyar felhasználó felület”-et is telepítve magyar nyelven is. (A LibreOffice 6.0 várhatóan két hónapon belül, 2018. január végén kerül kiadásra, amelyet havonként még több hibajavító kiadás fog követni, így a béta 2 program valóban csak kipróbálásra javasolt.)

A videóban és az alábbi képernyőképen is látható módon, a kipróbáláshoz az újonnan létrehozott felhasználói szótárat az alapértelmezett „összes nyelv” helyett magyar (vagy angol stb.) nyelvűre kell állítanunk az új Nyelvi minta mező eléréséhez.

A fejlesztő Németh László. A fejlesztés az FSF.hu Alapítvány támogatásával készült el 2017-ben. Az alapítvány támogatója a jelentős részben a HUP portál köré szerveződő magyar szabad szoftveres közösség.

Köszönjük a támogatást!

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Jó dolog világszinten sikeres magyar szoftvereket, megoldásokat látni.

+1E6
--
eutlantis

+1

jó cuccnak tűnik

gratula hozzá, masszív fejlesztésnek tűnik, a toldalékolás az egyik része a nyelvünknek amitől mindenki lábrázást kap tőlünk bármelyik földrajzi irányba indulva :)

Jelzi, ha olyan szavat akarnak megadni nyelvi mintának, ami nem szerepel a szótárban?

-----
„Egy jó kapcsolatban a társunkat az ő dolgában kell támogatni, nem a miénkben.”
rand() a lelke mindennek! :)
Szerinted…

Igen, feldobja a következő hibaüzenetet:

http://www.numbertext.org/hup/nyelvi_minta_hibauzenet.png

Ügyes.

Respect.

> youtuber

Hm. Volt itt egy régebbi vita[link] a szpem(m)el/dzsem(m)el/stb szavak helyesírásáról. Ez az új fejlesztés valahogy dönt ebben a kérdésben?

Nem, mert ez a toldalék nem igazán produktív, nincs is rá külön toldalékolási szabály a szótárban. Döntsön a felhasználó, főleg, ha mindkét átírás a kiejtést tükrözi. (A „szkennel” pl. már hivatalos átírás, de most felvehető eggyel is. Ahogy egy szlovákiai magyar szövegben is a „jogurt” lehet a helyes.
Érdekességképp, a német Duden szótárba felvették az ick szót az ich mellé „köznyelvi, főleg berlini” megjegyzéssel, úgyhogy bármi lehet(ne) a spamből is (de mivel van rá „kéretlen levél”, „levélszemét” stb. magyar megfelelő, valószínű, hogy nem fog elterjedni már, hiába szerepel valamiért a nem hivatalos „szpem” átírás a 6. osztályos „tartós”, de ritka rondán összecsapott nyelvtankönyv egyik példájában).

( > nincs is rá külön toldalékolási szabály a szótárban.

nem akartam belemenni. Szerintem van rá szabály: ha a főnévi alak jön át az angolból /szpem, szken, dzsem/ akkor azt a magyar helyesírás szabályai szerint -el/-ol/-al végződéssel ellátva értelemszerű hogy mit kapunk, ha meg az angol ragozott alak jön át /spamming, scanner, jamming/, akkor az ahogyan ott létezik, dupla betűsen jön. (ha elképesztő ostobaságot írtam nem muszáj belemenned, én nem értek hozzá)

Nyilván lehet arra számítani hogy a programod működése lesz a standard. Hogy jó előre fel tudjak készülni lélekben, csak azért kérdeztem )

> valószínű, hogy nem fog elterjedni már, hiába szerepel valamiért a nem hivatalos „szpem” átírás a 6. osztályos „tartós”, de ritka rondán összecsapott nyelvtankönyv egyik példájában

Én használom a "szpemel" szót. Se a "spam-el", se a "spamel" nem tetszik, idegen szavak ragozására tudtommal még ajánlás/szabály sincs: nyilvánvaló, egyszerűen ne ragozzunk idegen szavakat.

Ha főnévként használom akkor spam, de ragozva már szpemel, ez ilyen összvér megoldás amíg jobb nincs. Vagy tudsz jobbat? ((a leyoutubereztékkel ellentétben a spamel esetében nem nyilvánvaló hogy egy ragozott idegen szó, és szvsz annyira rossz az olvashatósága, hogy nem akarom így használni. (Azon kívül persze hogy az Akadémia nem mondja meg hogy hogyan is kéne.)))

nagyon kafa. Ha lehetne kérni akkor mac-es verziót is csináljatok hu-ból. thx.

--
GPLv3-as hozzászólás.

Az igény felmerült többek részéről, hogy legyen macOS-re frissített magyar szótárcsomag, de nem néztünk még utána, hogy ez hogyan oldható meg, úgyhogy bármilyen információnak örülünk ezzel kapcsolatban.

Köszönünk minden hozzászólást!

https://vmiklos.hu/blog/basic-epub3-export.html

----
"Kb. egy hónapja elkezdtem írni egy Coelho-emulátort, ami kattintásra generál random Coelho-kompatibilis tartalmat."

Nagyon jó, köszönjük!
--
Csaba