- A hozzászóláshoz be kell jelentkezni
- 3823 megtekintés
Hozzászólások
Tényleg félelmetes a küzdelem. Még reménytelenebb helyzetben vannak az adatbázis kezelők, ui. kiderült, hogy a helyesírás ismerete nélkül (amihez szótár kell), nem lehet stringeket abc szerint, a magyar szabályok szerint helyesen rendezni. És tulajdonképpen nincs is értelme vesződni vele.
--
ulysses.co.hu
- A hozzászóláshoz be kell jelentkezni
Az „ál” kettősbetűk, valamint nem egyértelmű alakok felismeréséhez kell, például „pácsó”, „házszám”, melyek jóval ritkábbak a rendes kettősbetűknél. A glibc ez utóbbiak szerint tokenizál, így az előbbi példa szavakat tévesen rendezi. Hogy ennek van-e értelme, elég jó-e, az szubjektív – szerintem igen.
- A hozzászóláshoz be kell jelentkezni
Jó sok van belőlük:
https://hu.wikipedia.org/wiki/Kett%C5%91s_bet%C5%B1vel_egybees%C5%91_be…
Vajon nem kellett volna például a 'cs'-hez külön billentyűt és unikódpontot rendelni?
--
eutlantis
- A hozzászóláshoz be kell jelentkezni
„Vajon nem kellett volna például a 'cs'-hez külön billentyűt és unikódpontot rendelni?”
Egyszerűbben meg lehet(ne) oldani: Az ilyen esetekben legyen kötelező a kötőjel. Például arc-csont, pác-só.
- A hozzászóláshoz be kell jelentkezni
+1 -- és részvétem a fejlesztőknek! :)
- A hozzászóláshoz be kell jelentkezni
> arc-csont, pác-só
Ez a katalán középső pontra emlékeztet.
- A hozzászóláshoz be kell jelentkezni
> Vajon nem kellett volna például a 'cs'-hez külön billentyűt és unikódpontot rendelni?
Érdekes gondolat... de szerintem nem.
A billentyű már most is szűk keresztmetszet, 9-cel több különböző szimbólumot kell elérni, mint angolul gépeléskor, így meg bejönne még 9 új. Nem férnének el, vagy kiütnék a számokat shift-esre (mint a francia billentyűzeten az ékezetek), az okostelefonon gépelésről nem is beszélve.
Az ábrázolás is valószínűleg sokkal-sokkal több problémát vetne fel, mint amennyit megoldana. Például a hosszú kettősbetűket (pl. „ssz”) hogyan jelölnéd, és a szoftverek mitől tudnák helyesen megjeleníteni?
Aztán ott van az, hogy egy ilyen megközelítés esetén aki nem beszéli az adott nyelvet, az képtelen lenne látott szöveget bevinni azon a nyelven.
A Unicode értelmes kompromisszumokat keresett, 100%-ig pedáns megoldások helyett. Nem vezetett be külön kódpontot az angol „sh”, „th” stb. számára sem. Vagy például nem különbözteti meg a magyar és a német „ö” betűt sem, holott tradicionálisan tudtommal az egyiken kissé alacsonyabban, a másikon kissé magasabban van az ékezet (nem emlékszem, hogy melyik melyik).
- A hozzászóláshoz be kell jelentkezni
Vannak digráfok a Unicode-ban, pl. a holland ij. Másrészt erről a vonatról már lekéstünk, az MTA nem kapcsolt időben, a Unicode Consortium hivatalos hozzáállása azóta pedig már az "elmentek a büdös 'csába" (http://www.unicode.org/faq/ligature_digraph.html), mert visszamenőleg minden szöveget át kéne írni, hogy egyértelmű legyen. De semmi gond, lehet helyette használni a U+034F COMBINING GRAPHEME JOINER jelet, amihez ugyan szintén át kéne írni visszamenőleg minden szöveget, szoftvert...
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
- A hozzászóláshoz be kell jelentkezni
> Unicode Consortium hivatalos hozzáállása azóta pedig már az "elmentek a büdös 'csába"
Nagyon helyes! A Unicode-nak nem feladata hozzáadnia az íráshoz olyan szemantikát, amely a (papírra) írott szövegben nem szerepel. Ha lehetővé is tesz ilyet (például elválasztási pontok), annak láthatatlannak és opcionálisnak kell lennie.
Tömény szívás lenne, ha lenne cs, dz, dzs stb. digráfunk meg trigráfunk. Kellene kétféle lehetséges mód a nagybetűsítésre (csak az eleje, vagy végig), hozzá megfelelő API és támogatás minden szinten, minden releváns szoftverben. Megjelenítés fix szélességű betűkészlettel. Megjelenítés terminál emulátorban. Duplázás (például ccs) kezelése hogyan, mondjuk font szinten cs+cs ligatúraként? A terminál emulátor meg találja ki magától, hogy 2+2=3? Vagy külön trigráf (és kvadrográf vagy hogy is hívják a ddzs-re)? Az összes téves használat (pl. cs helyett c és s, vagy fordítva) láthatatlan volna szokásos szövegszerkesztőben, nyomtatásban stb., külön célszoftvert kellene mindig használni a szöveg átolvasására. Lehet, hogy egy-két dolog egyszerűbb volna abban a világban, de biztos vagyok benne, hogy a dolgok 99%-a sokkal bonyolultabb lenne teljesen értelmetlenül.
- A hozzászóláshoz be kell jelentkezni
Lehet, hogy egy-két dolog egyszerűbb volna abban a világban, de biztos vagyok benne, hogy a dolgok 99%-a sokkal bonyolultabb lenne teljesen értelmetlenül.
Na, ez mondjuk a magyar helyesírásra egy-az-egyben igaz, csak a lenne-volna nélkül ;).
A "környéken" gyakorlatilag mindenki tök jól el van a változatos diakritikus jelekkel jelölt mássalhangzókkal (és a fenti problémák _mind_ meg vannak oldva velük...)... fájna átállni? Fájna. Hosszabb távon jobb lenne? Igen.
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
- A hozzászóláshoz be kell jelentkezni
Most akkor digráfokról (kettősbetű) vagy diakritikus jelekről (ékezet) beszélünk? Mert nagyon nem ugyanaz a kettő.
Szerk.: Vagy a nyelvben kellene átállnunk előbbiről az utóbbira? Ezzel kapcsolatban lásd a kissé lejjebbi kommentemet.
- A hozzászóláshoz be kell jelentkezni
Igen, át kéne állnunk. Ha meg arra lentebbi kommentedre gondolsz, hogy az IT mindent irányítani akar...
Nem. Lássuk be, nagyon sokan így se tudják helyesen használni a digráfokat/trigráfokat (pl. az elválasztásuk, hasonulásaik stb. - különösen szép ez, amikor egy már értelmét vesztett, "dehátrégenjóvoltaz" miatt megtartott ly-ról beszélünk... na, azt kukázni kéne egy az egyben), az csak extra lenne, hogy sok minden más algoritmizálhatóvá válna ezzel.
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
- A hozzászóláshoz be kell jelentkezni
Szerintem meg nem. Az indexelésnek gyorsnak kell lennie, nem jó ilyenekkel pöcsölni. De mi az egész abc-be rendezés eredeti értelme? Hogy kiszámítható helyen megtalálhatók legyenek a szavak. A magyar szabályok ennek eleve ellentmondanak. És ráadásul még az implementáció is hibás.
--
ulysses.co.hu
- A hozzászóláshoz be kell jelentkezni
Senki nem erőlteti rád, nem muszáj használni, választhatsz másmilyen rendezést is. :)
> De mi az egész abc-be rendezés eredeti értelme? Hogy kiszámítható helyen megtalálhatók legyenek a szavak.
Így van. De ha az eredeti értelmét kérdezed, akkor tegyük hozzá, hogy emberek (általában a nyelvet beszélő emberek), és nem gépek számára.
> A magyar szabályok ennek eleve ellentmondanak.
Csak ha nem ismered a nyelv szavait.
> És ráadásul még az implementáció is hibás.
A glibc esetén: nem jobban, mint amennyire szükségszerűen korlátozott a tudása a nyelv nem ismerete miatt a pácsónál és társainál.
Ha úgy állnánk hozzá, hogy csak tökéleteset szabad alkotni, akkor nagyon, de nagyon sok dolog nem létezne, ami létezik és roppant hasznos. Például helyesírás-ellenőrzők se lennének, csak hogy egy roppant közelit említsek.
- A hozzászóláshoz be kell jelentkezni
Ha csak nem volna tökéletes. De ahhoz képest, hogy értelmetlen, még rossz is. És ez persze inkább a magyar nyelvtan hibája.
--
ulysses.co.hu
- A hozzászóláshoz be kell jelentkezni
> a magyar nyelvtan hibája
Teljesen hibásnak tartom azt a szemléletet, hogy az írást, nyelvet, nyelvtant, kultúrát, hagyományt stb. kelljen a számítástechnikai igényeihez igazítani. A számítástechnikának kell kiszolgálnia – minél észszerűbb mértékben és minőségben, ha tökéletesen nem is megy – az emberiséget, a hagyományaival, következetlenségeivel együtt.
Ha Te nem is veszed hasznát, hidd el, megvan annak a maga helye, ha egyes szoftverek képesek kevés speciális kivételtől eltekintve helyesen magyarul ábécébe rendezni.
- A hozzászóláshoz be kell jelentkezni
+1
Az ITra kifejezetten jellemző ez a fajta lovon fordítva ücsörgés, meg arrogancia, amit már "a kilo 1000-et jelent, és SI? Nem baj, nekünk az 1024 kényelmesebbel" elkezdtek(tünk). (Bónuszként ugyanezek az emberek kéjesen jól szórakoznak az angolszászok hülye mértékegységein.) És azóta is rendszeresen folytatunk, mikor azt gondoljuk, hogy az IT cél, és nem eszköz.
- A hozzászóláshoz be kell jelentkezni
Sajnos nálam nem megy a LibreOffice 6.
Már többször újratelepítettem a Win10 64 bites verziót (pl. ma is adtam neki egy esélyt).
Amint leütök egy betűt a Writerbe vagy Calcba. Egyből elszáll.
- A hozzászóláshoz be kell jelentkezni
erre próbálkozz
- A hozzászóláshoz be kell jelentkezni
Én ugyanezt tapasztalom 6.0.2 és Win 10 esetén 64 biten (otthoni munkaállomás). Win 8.1 64 biten (munkahely) és Debian 9 64 biten (saját laptop) viszont stabilan működik.
- A hozzászóláshoz be kell jelentkezni
A 64 bites verzióval tényleg úgy tűnik hogy gondok vannak - viszont az furcsa hogy az egyik gépen minden további nélkül működik, a másikon viszont hasonló a jelenség, mint amit írsz. Viszont a 32 bites verzió az minden probléma nélkül működik. (Windows 8.1-en tapasztalom ezeket)
- A hozzászóláshoz be kell jelentkezni
Köszönöm. A 32 bites tényleg működik. Most ezt használom.
Gondolkodtam, hogy feladjam hibajegyként, de kétségeim merültek fel, hogy vajon le tudják-e a redmine-ból vadászni spam gyártók az email címemet ami a reghez kell?
- A hozzászóláshoz be kell jelentkezni
Szerintem meg a magyar szavakhoz használjuk a székely/ősmagyar ábécét. ;) 44 betű 44 hanghoz. ;)
Amúgy ez meg benne van az Unicode 8.0-ban. (Range: U+10C80..U+10CFF)
- A hozzászóláshoz be kell jelentkezni