Magyar nyelvi fejlesztések V.

LibreOffice, OpenOffice.org

A magyar helyesírás félelmetes küzdelmét élőben követi a LibreOffice frissített helyesírási szótára. A pár ezer változás részeként újra helyessé vált a dinó (rövid i-vel) szó (Magyar helyesírási szótár, Akadémiai Kiadó, 2017), miközben helyes maradt a dínó is (A magyar helyesírás szabályai, 12. kiadás, Akadémiai Kiadó, 2015), amíg el nem dől hivatalosan, melyikük a győztes. A felhasználók többsége azonban nagyobb hasznát veheti annak, hogy az automatikus kereszthivatkozások névelői és toldalékai is ellenőrzésre kerülnek, pl. *(3)-ben → (3)-ban, *f)-t → f)-et, az b) pontban → a b) pontban, ahogy a következő videófilmben (már nem *videofilm!) is látható.

Erről, és az FSF.hu Alapítvány támogatásával megvalósult egyéb fejlesztésekről részletesen a LibreOffice.hu számol be, felsorolva a LibreOffice, a Lightproof mondatellenőrző és a Szabad magyar szótár kapcsolódó változásait.

A hozzászóláshoz be kell jelentkezni
3823 megtekintés

Tényleg félelmetes a küzdelem. Még reménytelenebb helyzetben vannak az adatbázis kezelők, ui. kiderült, hogy a helyesírás ismerete nélkül (amihez szótár kell), nem lehet stringeket abc szerint, a magyar szabályok szerint helyesen rendezni. És tulajdonképpen nincs is értelme vesződni vele.
--
ulysses.co.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az „ál” kettősbetűk, valamint nem egyértelmű alakok felismeréséhez kell, például „pácsó”, „házszám”, melyek jóval ritkábbak a rendes kettősbetűknél. A glibc ez utóbbiak szerint tokenizál, így az előbbi példa szavakat tévesen rendezi. Hogy ennek van-e értelme, elég jó-e, az szubjektív – szerintem igen.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Jó sok van belőlük:
https://hu.wikipedia.org/wiki/Kett%C5%91s_bet%C5%B1vel_egybees%C5%91_be…

Vajon nem kellett volna például a 'cs'-hez külön billentyűt és unikódpontot rendelni?

--
eutlantis

0 szavazat

A hozzászóláshoz be kell jelentkezni

„Vajon nem kellett volna például a 'cs'-hez külön billentyűt és unikódpontot rendelni?”

Egyszerűbben meg lehet(ne) oldani: Az ilyen esetekben legyen kötelező a kötőjel. Például arc-csont, pác-só.

1 szavazat

A hozzászóláshoz be kell jelentkezni

+1 -- és részvétem a fejlesztőknek! :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

> arc-csont, pác-só

Ez a katalán középső pontra emlékeztet.

0 szavazat

A hozzászóláshoz be kell jelentkezni

> Vajon nem kellett volna például a 'cs'-hez külön billentyűt és unikódpontot rendelni?

Érdekes gondolat... de szerintem nem.

A billentyű már most is szűk keresztmetszet, 9-cel több különböző szimbólumot kell elérni, mint angolul gépeléskor, így meg bejönne még 9 új. Nem férnének el, vagy kiütnék a számokat shift-esre (mint a francia billentyűzeten az ékezetek), az okostelefonon gépelésről nem is beszélve.

Az ábrázolás is valószínűleg sokkal-sokkal több problémát vetne fel, mint amennyit megoldana. Például a hosszú kettősbetűket (pl. „ssz”) hogyan jelölnéd, és a szoftverek mitől tudnák helyesen megjeleníteni?

Aztán ott van az, hogy egy ilyen megközelítés esetén aki nem beszéli az adott nyelvet, az képtelen lenne látott szöveget bevinni azon a nyelven.

A Unicode értelmes kompromisszumokat keresett, 100%-ig pedáns megoldások helyett. Nem vezetett be külön kódpontot az angol „sh”, „th” stb. számára sem. Vagy például nem különbözteti meg a magyar és a német „ö” betűt sem, holott tradicionálisan tudtommal az egyiken kissé alacsonyabban, a másikon kissé magasabban van az ékezet (nem emlékszem, hogy melyik melyik).

0 szavazat

A hozzászóláshoz be kell jelentkezni

Vannak digráfok a Unicode-ban, pl. a holland ij. Másrészt erről a vonatról már lekéstünk, az MTA nem kapcsolt időben, a Unicode Consortium hivatalos hozzáállása azóta pedig már az "elmentek a büdös 'csába" (http://www.unicode.org/faq/ligature_digraph.html), mert visszamenőleg minden szöveget át kéne írni, hogy egyértelmű legyen. De semmi gond, lehet helyette használni a U+034F COMBINING GRAPHEME JOINER jelet, amihez ugyan szintén át kéne írni visszamenőleg minden szöveget, szoftvert...

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

> Unicode Consortium hivatalos hozzáállása azóta pedig már az "elmentek a büdös 'csába"

Nagyon helyes! A Unicode-nak nem feladata hozzáadnia az íráshoz olyan szemantikát, amely a (papírra) írott szövegben nem szerepel. Ha lehetővé is tesz ilyet (például elválasztási pontok), annak láthatatlannak és opcionálisnak kell lennie.

Tömény szívás lenne, ha lenne cs, dz, dzs stb. digráfunk meg trigráfunk. Kellene kétféle lehetséges mód a nagybetűsítésre (csak az eleje, vagy végig), hozzá megfelelő API és támogatás minden szinten, minden releváns szoftverben. Megjelenítés fix szélességű betűkészlettel. Megjelenítés terminál emulátorban. Duplázás (például ccs) kezelése hogyan, mondjuk font szinten cs+cs ligatúraként? A terminál emulátor meg találja ki magától, hogy 2+2=3? Vagy külön trigráf (és kvadrográf vagy hogy is hívják a ddzs-re)? Az összes téves használat (pl. cs helyett c és s, vagy fordítva) láthatatlan volna szokásos szövegszerkesztőben, nyomtatásban stb., külön célszoftvert kellene mindig használni a szöveg átolvasására. Lehet, hogy egy-két dolog egyszerűbb volna abban a világban, de biztos vagyok benne, hogy a dolgok 99%-a sokkal bonyolultabb lenne teljesen értelmetlenül.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Lehet, hogy egy-két dolog egyszerűbb volna abban a világban, de biztos vagyok benne, hogy a dolgok 99%-a sokkal bonyolultabb lenne teljesen értelmetlenül.

Na, ez mondjuk a magyar helyesírásra egy-az-egyben igaz, csak a lenne-volna nélkül ;).

A "környéken" gyakorlatilag mindenki tök jól el van a változatos diakritikus jelekkel jelölt mássalhangzókkal (és a fenti problémák _mind_ meg vannak oldva velük...)... fájna átállni? Fájna. Hosszabb távon jobb lenne? Igen.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Most akkor digráfokról (kettősbetű) vagy diakritikus jelekről (ékezet) beszélünk? Mert nagyon nem ugyanaz a kettő.

Szerk.: Vagy a nyelvben kellene átállnunk előbbiről az utóbbira? Ezzel kapcsolatban lásd a kissé lejjebbi kommentemet.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Igen, át kéne állnunk. Ha meg arra lentebbi kommentedre gondolsz, hogy az IT mindent irányítani akar...

Nem. Lássuk be, nagyon sokan így se tudják helyesen használni a digráfokat/trigráfokat (pl. az elválasztásuk, hasonulásaik stb. - különösen szép ez, amikor egy már értelmét vesztett, "dehátrégenjóvoltaz" miatt megtartott ly-ról beszélünk... na, azt kukázni kéne egy az egyben), az csak extra lenne, hogy sok minden más algoritmizálhatóvá válna ezzel.

BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Szerintem meg nem. Az indexelésnek gyorsnak kell lennie, nem jó ilyenekkel pöcsölni. De mi az egész abc-be rendezés eredeti értelme? Hogy kiszámítható helyen megtalálhatók legyenek a szavak. A magyar szabályok ennek eleve ellentmondanak. És ráadásul még az implementáció is hibás.
--
ulysses.co.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

Senki nem erőlteti rád, nem muszáj használni, választhatsz másmilyen rendezést is. :)

> De mi az egész abc-be rendezés eredeti értelme? Hogy kiszámítható helyen megtalálhatók legyenek a szavak.

Így van. De ha az eredeti értelmét kérdezed, akkor tegyük hozzá, hogy emberek (általában a nyelvet beszélő emberek), és nem gépek számára.

> A magyar szabályok ennek eleve ellentmondanak.

Csak ha nem ismered a nyelv szavait.

> És ráadásul még az implementáció is hibás.

A glibc esetén: nem jobban, mint amennyire szükségszerűen korlátozott a tudása a nyelv nem ismerete miatt a pácsónál és társainál.

Ha úgy állnánk hozzá, hogy csak tökéleteset szabad alkotni, akkor nagyon, de nagyon sok dolog nem létezne, ami létezik és roppant hasznos. Például helyesírás-ellenőrzők se lennének, csak hogy egy roppant közelit említsek.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha csak nem volna tökéletes. De ahhoz képest, hogy értelmetlen, még rossz is. És ez persze inkább a magyar nyelvtan hibája.
--
ulysses.co.hu

0 szavazat

A hozzászóláshoz be kell jelentkezni

> a magyar nyelvtan hibája

Teljesen hibásnak tartom azt a szemléletet, hogy az írást, nyelvet, nyelvtant, kultúrát, hagyományt stb. kelljen a számítástechnikai igényeihez igazítani. A számítástechnikának kell kiszolgálnia – minél észszerűbb mértékben és minőségben, ha tökéletesen nem is megy – az emberiséget, a hagyományaival, következetlenségeivel együtt.

Ha Te nem is veszed hasznát, hidd el, megvan annak a maga helye, ha egyes szoftverek képesek kevés speciális kivételtől eltekintve helyesen magyarul ábécébe rendezni.

1 szavazat

A hozzászóláshoz be kell jelentkezni

+1

Az ITra kifejezetten jellemző ez a fajta lovon fordítva ücsörgés, meg arrogancia, amit már "a kilo 1000-et jelent, és SI? Nem baj, nekünk az 1024 kényelmesebbel" elkezdtek(tünk). (Bónuszként ugyanezek az emberek kéjesen jól szórakoznak az angolszászok hülye mértékegységein.) És azóta is rendszeresen folytatunk, mikor azt gondoljuk, hogy az IT cél, és nem eszköz.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Sajnos nálam nem megy a LibreOffice 6.
Már többször újratelepítettem a Win10 64 bites verziót (pl. ma is adtam neki egy esélyt).
Amint leütök egy betűt a Writerbe vagy Calcba. Egyből elszáll.

0 szavazat

A hozzászóláshoz be kell jelentkezni

erre próbálkozz

0 szavazat

A hozzászóláshoz be kell jelentkezni

Én ugyanezt tapasztalom 6.0.2 és Win 10 esetén 64 biten (otthoni munkaállomás). Win 8.1 64 biten (munkahely) és Debian 9 64 biten (saját laptop) viszont stabilan működik.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A 64 bites verzióval tényleg úgy tűnik hogy gondok vannak - viszont az furcsa hogy az egyik gépen minden további nélkül működik, a másikon viszont hasonló a jelenség, mint amit írsz. Viszont a 32 bites verzió az minden probléma nélkül működik. (Windows 8.1-en tapasztalom ezeket)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszönöm. A 32 bites tényleg működik. Most ezt használom.

Gondolkodtam, hogy feladjam hibajegyként, de kétségeim merültek fel, hogy vajon le tudják-e a redmine-ból vadászni spam gyártók az email címemet ami a reghez kell?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Szerintem meg a magyar szavakhoz használjuk a székely/ősmagyar ábécét. ;) 44 betű 44 hanghoz. ;)
Amúgy ez meg benne van az Unicode 8.0-ban. (Range: U+10C80..U+10CFF)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Magyar nyelvi fejlesztések V.

Hozzászólások