Magyar nyelvi fejlesztések I.

Címkék

Mellékelten küldjük Önnek szíves felhasználásra Németh László aktivistánk munkájáról szóló „Magyar nyelvi fejlesztések I.” sajtóanyagát.

Az új magyar helyesírási reformhoz kötődő szabad szoftveres magyar nyelvi fejlesztés 2015-ben vette kezdetét (l. ennek részletes ismertetését). Az FSF.hu Alapítvány támogatásának köszönhetően a fejlesztés nem áll le, első eredményeként a LibreOffice helyesírási szótárából eltávolításra kerültek az elavult helyesírású szavak és toldalékolási szabályok (tdf#95024). Példák a már elutasított szóalakokra (a listában szereplő töveket külön vagy más alakban írjuk ma már, a toldalékolt szavakat pedig kötőjellel), gyakorisági sorrendben: zártkörű,nagyméretű, kisméretű, ésszerűtlen, útbaigazít, véghezvisz, nemzetiszínű, ésszerűsödik, cserbenhagy, ésszerűsít, chips, reváns, látencia, bura, napéjegyenlőség, síkraszáll, cigánygyerek, házinyúl, árboc, eszencia, latens, piercing, célratörés, Sydneyt, talián, Zsanettel, sorbaállás, frizsider, sztyep, sósperec, magasrendű, csodaszép, sóskifli, rubeóla, Huxleyt, fejbentartás, samanizmus, Nikolettel, fantaziál, elektroencefalográfia, Nagymedve, Henriettel, dinó, Anettel, harcbavetés, nüánsz, Ivettel, Stanleyről, Disneytől, bedekker, nagyfokú, elektroencefalogram, elektroencefalográf.

A szótár előzetes kiadásának további újdonságai:

Sok új idegen szó és átírás: acerola, albedó, anthrax, baklava, bermuda, bestiarium, biometrikus, blogger, bonmot, bourbon, bowling, break, campanile, campus, ciabatta, defibrillátor, dévédé, dietetika, diszacharid, dragomán, durián, ego, epilátor, europid, euroszkeptikus, falafel, fieszta, gaucho, gnocchi, gouda, guava, hacker, hekker, hospice, illiberalizmus, intimtorna, intró, jalapeño, jujuba, kabrió, kanül, karambola, kesu, klapancia, kolonoszkópia, komment, konnotáció, kozmetológus, lasagne, licsi, lúzer, machinátor, manga, monitoring, monsieur, muffin, nanogép, op-art, outlet, palimpszeszt, pécé, pirszing, píszí, playback, poligráf, pomeló, purhab, rafting, ranch, raszta, remix, rep, retró, roadshow, roaming, rukkola, sármos, shake, showman, ska, slam, stand-up, stria, szadomazó, szaké, szantál, szcenárió, szmájli, sztrók, triller, troll, úzó, varánusz, vok, vombat, xilit, zumba, zsenília stb.

Kimaradt szavak, új szóalkotások: agymosott, bérmaszülő, cicamica, dombornyomott, extraszűz, fogvacogtató, gyorsétkezde, gyorshitel, hitelkárosult, jegestea, kaszat, kényszervágott, melegrekord, nagyember, pihepuha, rezzenetlen, szegényellenes, téligumi, Tina, V4, versenysemleges, Zsombi stb.

Évszámok helyesírása: Az 2001–2099 közötti évszámok új, kötőjel nélküli írásmódjának támogatása (az egyéb számok továbbra is kötőjellel írandók): kétezeregy, kétezerkilencvenkilenc.

Szótárhibák javítása: pl. behaviourizmus (behaviorizmus vagy bihéviorizmus), autóbuszmegálló (autóbusz-megálló), metilalkohol (metil-alkohol), Alpokok (Alpok már többesszámban) stb.

Korpuszelemzés alapján sok, korábban a nem tárgyas ragozású igék csoportjába sorolt szóval bővült a tárgyas ragozású igék csoportja: bezsákolta, elbukta, végigasszisztálja, átpolitizálja, búgta, cincogta, dorombolta, vakkantotta, röfögte,  habogta, makogta, mekegte, susogja, zsongja, vicsorogta, hallucinálta, dudorászta, kicsodálkozta és kidühöngte magát, végigunatkozza, szomjúhozza, öltözzétek fel
stb.

A szótári köznevekből képzett tulajdonnevek -beli, -féle toldalékolásának elfogadása: Neveléstudomány-beli, Arany-féle

Rövidítések toldalékolásának bővítése: bt.-beli, kft.-beli, nyrt.-beli, Btk.-beli stb.

A rendhagyó szótári összetett szavak többszörös összetételben való szereplésének javítása: egylégterű (egy légterű), kéttantermes (két tantermes), turistaútleveles (turista-útleveles)

A Hunspell helyesírás-ellenőrző javításai (c44200) kiegészítik az új helyesírásnak megfelelő többszörös szóösszetételek felismerését. Így a 7-szótagos, -i képzőre végződő többszörösen összetett szavak most már minden esetben elfogadásra kerülnek (a képzős tagot – pl. biztosítás – tartalmazó szavak korábban csak további toldalékkal kerültek elfogadásra: nyugdíjbiztosításit). Most már felismert szavak: nyugdíjbiztosítási, műsorszolgáltatási, aláírásgyűjtési, tanügyigazgatási, munkahelyteremtési, elsősegélynyújtási, egyházlátogatási, rendszerirányítási, bérlakásépítési, balesetmentességi, ügyiratkezelési, létszámleépítési, jogszabályalkotási, adóvégrehajtási, védjegylajstromozási, egyházalapítási, nyugdíjfolyósítási, útvonaltervezési, közteherviselési, kényszertartózkodási, alagútépítési, önköltségszámítási, ügyvitelszervezési, sportszakigazgatási, pénzügyigazgatási, létszámgazdálkodási, részköltségszámítási, lakóházépítési, emlékműállítási, színházalapítási, raktárgazdálkodási, baromfitenyésztési, rendszerváltoztatási, rendszerintegrálási, színházlátogatási, rendszerkiépítési, raktárirányítási, leltárértékelési, könyvtárlátogatási, készpénzbefizetési, térfogatszámítási, erőműépítési stb.

Szintén a Hunspell ellenőrzőt érintő javításnak köszönhető a korábban elfogadott, kötőjelet tartalmazó szavak tiltása: n-t (n-et) össze-vissza (összevissza), örökkön-örökké (örökkön örökké).

A szótárfejlesztő eszközök és a szótárleírás megvalósult optimalizálásával felgyorsult a szótárfejlesztés és a parancssori helyesírás-ellenőrzés.

Utóbbira példa: az -s és -c végű, de idegen ejtésű szavak toldalékolási szabállyal való leírása nemcsak kisebb szótárat eredményezett a több száz külön felvett toldalékos alak eltávolításával, hanem lehetővé teszi a parancssori Hunspell programban az idegen szavak automatikus toldalékolással való felvételét

Így a felhasználó most már helyesen adhat meg ilyen töveket maga is a parancssori Hunspell felületén, vagy a Hunspell saját szótárában (l. man Hunspell):

Linus/Thomas
corpus/opus
Alec/Cadillac

így a Hunspell a szótári Thomas szerint helyesen ragozza a felhasználó által felvett Linus szót: Linusszal,
Linusszá
, az opus alapján a corpus szót:

corpusszal, corpusszá, a Cadillac alapján az Alec szót: Aleckel, Alecké, vagyis nem a hibás változatokat
erőlteti, illetve fogadja el (Linussal, corpussal, Aleccel stb.), mint korábban.

Kisebb LibreOffice fejlesztésként rugalmasabbá vált a LibreLogo program, így a LibreOffice 5.4 következő kiadása már Ubuntu és macOS operációs rendszereken is rendelkezni fog magyar lokalizációval (tdf#113592).

Hozzászólások

Valaki utbaigazitana? A latens buzit most hogyan kell irni? Csak nekem hangzik esszerutlenul a fenti eleg nagymeretu lista?

---
Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

Elolvastam.
Nem tudok az anyanyelvemen írni.
+ az "Aleckel, Alecké" betette a kaput.

Egyfelől minden tiszteletem Németh Lászlónak a rengeteg munkáért, másfelől lehetne kérni, hogy a helyesírási szótárban a fent felsorolt elavultnak tekintett szavak továbbra is maradjanak meg mint helyes formátum?

Anyanyelvi beszélőként nem értek egyet azzal, hogy a Magyar Akadémia a Magyar Helyesírás Szabályai című mű 12. kiadásával ténylegesen a magyar nyelv helyesírását dokumentálták,és szándékosan nem úgy szeretném ezeket a szavakat írni ahogy ők gondolják hogy nekem kéne.

Most még nincs benne az új változat a disztrókban (de azért siess). Csak arra kell figyelned, hogy a hunspell és az OpenOffice csomagokat nem frissíted ezentúl. Ha a magyar helyesírásból a régit akarod, akkor meg kell békélned azzal, hogy ezekből a csomagokból is csak a régit használod. Biztos ami biztos, egy-két telepítőmédiát tegyél/mentsél el, mert 10–20 év múlva már nem lesz egyszerű beszerezni ezeket. :-)

Ha nem adoptálják, akkor a 13. kiadásban - már ha valaha is lesz ilyen - korrigálni kell.

A nyelvtan elsősorban deskriptív, azt írja le, a nyelv használói hogyan használják a nyelvet, nem pedig preskriptív hogy valaki megmondja, mi helyes és mi nem az.

Angol helyesírás szabályai pl nincsenek, van Oxford English Dictionary, meg Chicago Manual of Style.

„A nyelvtan elsősorban deskriptív, azt írja le, a nyelv használói hogyan használják a nyelvet, nem pedig preskriptív hogy valaki megmondja, mi helyes és mi nem az.”

Én is így gondolom, de ez nem ilyen előre eldöntött, ahogyan te szeretnéd.

-----
„Egy jó kapcsolatban a társunkat az ő dolgában kell támogatni, nem a miénkben.”
rand() a lelke mindennek! :)
Szerinted…

Nézd, a nyelv elsősorban a használóié. Az ezelőtti MHSZ 1984-es volt, közbe jött ugye a félhivatalos osiris kiadós valami, merthogy kezdett probléma lenni, hogy nincs standard formája mondjuk az email kifejezésnek.

Az Osiris-féle leginkább a divx-hez hasonlítható, menetközben kilopott kváziszabvány.

Na de ami kijött az rémálom és borzalom, a valós internetes nyelvhasználattól - ahol itt és most, és a belátható jövőben, a legtöbb magyar nyelvű írás fog keletkezni, ez is, amit épp gépelek - teljesen elrugaszkodott, mondhatni köszönőviszonyt sem ápoló elgondolás.

Egyszerűen egy élő nyelvre egy életképtelen szabványt nem lehet ráhúzni. Ha sokan ignorálják a leírt szabályokat, akkor a következő kiadásban (mint amúgy sok szó esetén teszi azt ez a mostani is) igazodni kell a többségi használathoz.

Szóval én megteszem azt, hogy ezeket a szabályokat, az érthetőség határain belül ignorálva, és ahol értelmes, az előző szabályzatot - MHSz 11 - betartva fogok írni, mert azt gondolom, hogy néhány idióta miatt nem fog megváltozni a nyelv, mégha azok az idióták őszintén azt is gondolják, hogy ez be fog következni, csak azért, mert épp ők voltak akkor és ott.

Hasonló történt a JavaScripttel is, emlékszünk-e még az ECMAScript 4-re? Na, azt is kitalálta a Nagyérdemű Testület, aztán látjuk, mi lett.

Valós internetes nyelvhasználaton mit értsünk? "Márko vok oszt csá"? "Linux-al"? Te az ímél, emodzsi stb. szavakra vagy kiakadva? Vagy az árbóc, búra és munkaerőpiaci sem tetszik? Inkább maradt volna árboc, bura és munkaerő-piaci?

Szerintem a szabad magyar helyesírás-ellenőrző nem tehet mást, mint az éppen aktuális akadémiai szabályzatot implementálja. Ez jól definiált feladat és védhető álláspont. Ha elfogadná a többé nem helyes alakokat is, azzal becsapná a felhasználókat.

A nyelv a valóban a használóé, a helyesírási szabályzat pedig az Akadémiáé. Nem törvény, nem szabály, hanem egy ajánlás. Ha csak úgy fel akarsz valamit firkálni az internetre, nem kell követned. Akkor kell követned, ha ki akarsz adatni egy szöveget egy kiadóval, vagy egy (igényesebb) újságba akarsz valamit leírni. Nem kell szeretni, de annyi előnye azért van, hogy nem lesz benne ugyanaz a szó négy különböző formája a szövegben, akkor sem, ha négyen írtátok.

Az sem baj, ha egy-két dologban ignorálod, vagy az előző kiadást használod. Ha kevered, és közben még az írásjeleket sem használod szépen, akkor viszont a szöveged nem egy művelt ember véleményének fog tűnni első olvasásra, hanem egy dühből odaböffentett irománynak.

Mivel a következő érettségin már pontot vonnak le a régi helyesírásért (az oktatás számára 3 év türelmi időt biztosítottak), opcionális lehetőségen gondolkodtunk (de persze azért is, hogy elejét vegyük a jogos vádnak, hogy a magyar helyesírást nem ismeri rendesen a helyesírás-ellenőrző).

A megoldás a következő friss fejlesztés lehet. A sajtóhírben is említett Hunspell parancssori toldalékoló saját szótár funkció a LibreOffice 6.0-ba is bekerült, szintén a magyar fejlesztésekhez kapcsolódóan, így ezzel remélhetőleg könnyen elkészíthető egy olyan grafikus felületen telepíthető kiegészítő, amely a régi alakok is tartalmazza (pl. „Bernadettel” az új „Bernadett-tel” mellett), úgy, hogy a régi tövek toldalékolva és összetett szavakban is elfogadásra kerülnek („lámpaburáinkat”, „hajóárbocokról” stb.).

Előzetes angol nyelvű ismertető a LibreOffice toldalékoló/összetételező saját szótáráról, angol és német példákkal: https://wiki.documentfoundation.org/ReleaseNotes/6.0#.E2.80.9CGrammar_B…

Ezzel olyan speciális igényeket is ki lehet majd elégíteni, mint az ly-s szavak pontos j-vel való elfogadása (nem ez volna a „leghüjébb” ötlet), de ami igazán hasznos, a felületen igény szerint bekapcsolható szaknyelvi helyesírási szótárak is hozzáadhatók lesznek a LibreOffice-hoz.

"Anyanyelvi beszélőként nem értek egyet azzal, hogy a Magyar Akadémia a Magyar Helyesírás Szabályai című mű 12. kiadásával ténylegesen a magyar nyelv helyesírását dokumentálták"
Leíró vs. előíró helyesírási szabályok, ugyebár. Az előíró nyelvészet egy eléggé meghaladott dolog ám.
Nem, nem az Akadémia gondolja úgy, hogy neked így kéne írnod a szavakat, hanem az iskolázott emberek többsége így írja a szavakat, ezért ez a helyesírásuk.
http://anyanyelvapolo.hu/ha-az-ember-nem-erzi-az-anyanyelvet-akkor-nehe…
Ez az interjú ezt jól ki is fejezi.
Ne az MTA akarja előírni, hogy hogyna kell valamit helyesen írni, azt majd eldönti az, aki magyarul beszél és ír, az MTA meg ezt szépen dokumentálja.

Így van. Ráadásul valamilyen szabályozásra mindenképpen szükség van.
Magyar anyanyelvűként is olykor nehezen értjük meg vagy inkább nehezen érezzük a magyar nyelv helyesírási szabályait, viszont el kell fogadnunk a szabályozást. Nem olyan nehéz azt megszokni. Ha a köznyelv nem fogadja el, akkor majd úgyis hozzá igazítják a szabályokat.
Azokat viszont nem irigylem akik tanult nyelvként használják a magyart! :)
--
Tertilla; Tisztelem a botladozó embert és nem rokonszenvezem a tökéletessel! Hagyd már abba!; DropBox

Először a magyar nyelv helyesírására férne rá egy alapos, átgondolt javítás, gépesíteni a dolgot csak azután.

-fs-
Az olyan tárgyakat, amik képesek az mc futtatására, munkaeszköznek nevezzük.
/usr/lib/libasound.so --gágágágá --lilaliba