magyar.ldf

Fórumok

Sziasztok.

A TeX-hez fejlesztett magyar.ldf szerkesztője, Szabó Péter állítólag mostanában elérhetetlen.

Tudtok valamit róla? Annyi ismeretem van, hogy a Fazekasban tanított.

Vagy csak a régi e-mail címei nem élnek?

-------

Legutóbb publikált doksijainak egyike ez:

http://csana84.web.elte.hu/downloads/others/LaTeX/magyarldf-doc.pdf

Hozzászólások

Nem ismerem, de nem kizárt, hogy pl. Facebookon vagy hasonlón megtalálod. Ez a baj ezekkel a nyelvi lokalizációkkal, nyelvi csomagokkal, hogy x ideig karbantartja valaki, aztán már nem, és nem frissítik többé. Meg van így, hogy emberek eltűnnek a netről, nincs velük semmi különös, csak nem érhetőek el, már találkoztam számos ilyen példával.

Szerintem ha annyira szükséged van rá, vedd át te a projektet. Már nem ez az első topik, amiben említed, szerintem rád marad a feladat. A kódja mindenesetre nyílt. Egy aktualizálást mindenképp megérne, mert az utolsó verzió óta a helyesírási szabályzat is változott. Ez ilyen hálátlan feladat, aki kapja, marja, nem sokan használják, eleve nincs jelentkező rá.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

sajnos a legtobb magyaritos projekt elhal eleg hamar, mondjuk nem egy tul izgalmas feladat, en se csinalnam szivesen, foleg ingyen... regen egy ideig foglalkoztam a zimbra magyaritassal, paran megkerestek miatta de inkabb passzoltam utana :)  aztan kb a 8-asnal lett hivatalos magyaritas, ami amugy nagyon gaz volt helyenkent, de onnantol senkit se erdekelt az enyem :) pedig eleg sok orat beleoltem, mert az nem annyibol all hogy fogod a txt es atirogatod a szavakat magyarra, mert ki kellett deriteni az adott 1-2 szavas entryk milyen kontextusban jelennek meg (a hivatalos magyaritas is elverzett olyanokon, hogy a 'forward' ott eppen level tovabbitast vagy elore lapozast jelent).

most epp osticket-hez keresek, 14-hez van elerheto magyaritas es az sem teljes, kozben mar 3 verzioval elorebb tartanak.

most epp osticket-hez keresek, 14-hez van elerheto magyaritas es az sem teljes, kozben mar 3 verzioval elorebb tartanak.

Úgy néz ki, hogy maga a projekt sem veszi túl komolyan a lokalizációt, a crowdinjukon csak az 1.15-ös kiadás fordítható, az 1.16-nak, 1.17-nek se híre, se hamva, így nem csoda hogy nincs kész.

A legtöbb minden nem szorul valójában magyarításra. Ezt az osticket-et nem ismerem, de olyasminek hangzik, amihez nem kell. De a LaTeX-hez a magyar.ldf vagy valami hasonló megoldás alap. Persze meg lehet lenni nélküle, de kényelmetlen, mert ha nem használsz ilyen megoldást, akkor se a szavak elválasztása, se toldalékolása, se semmi nem fog működni, és ugyan ezt mind megírhatja az ember magának, de majdnem akkora munka, mint egy meglévő megoldást karban tartani inkább.

Én XeTeX alatt a \uselanguage{hungarian} modult használom, ez plain TeX (nem LaTeX) variáns, nincsenek csomagok. Ez ahogy nézem a forrást, csak egy elválasztási modult használ, ami egy Nagy Bence nevű illető hyph-hu.tex megoldásán alapul, és igen korlátozottan működik, és csak az elválasztást oldja meg, azt is sokszor hiányosan, mivel csak egy fél megás szótári rész van benne (~62 ezer bejegyzéssel, de azok nem szavak, hanem több szóra illeszkedő minták), kézzel kell kivételeket hozzáadni a dokumentumban (vagy egy include-olt saját készítésű .tex modulban), pl. \hyphenation{ki-vé-tel bla-bla pél-da} formában vagy a szövegben adok hozzá kézzel eseti \- elválasztási pontokat, pl. ilyen mó\-don, stb.. A többiről ez a modul nem gondoskodik, toldalékolás, magyar tipográfiai szabályok (idézőjeltípus, ezt Unicode karakterekkel írom meg, illetve használni kell külön a \frenchspacing parancsot). Cserében viszont elég független az ember így, bár már erre az elválasztási modulra is ráférne egy ráncfelvarrás, mert ahogy nézem, még a régi helyesírási szabályzat szerint van 7+ évvel ezelőttről, azóta megváltozott néhány szó írásmódja, pl. összevissza helyett össze-vissza, ésszerű helyett észszerű, ilyesmik ez az elválasztást is érinthetik.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Ebben a topikban releváns. Igaz ezt minden hasonló topikjában a kollégának meg szoktam említeni, hátha egyszer meggyőzöm. Látszik ugyanis, hogy sok a gondja a LaTeX-szel, sokszor elavultság okán. Ez a sima TeX meg nem szokott reklámozva lenni sehol, aki emlegeti is, az is a LaTeX szinonimájaként használja tévesen, amiért nem hibáztatom, mert annyifelé használják így, meg annyi fork van már, hogy nehéz követni annak, aki nincs benne.

Amit azt a ticketing nyavalyát illeti, tényleg nem ismerem. Ez van. Az tényleg kínos, ha magyar célközönségnek készült és annak ellenére nem tud magyarul, bár továbbra se látom, hogy egy ticketing szoftvernek minek kéne magyarnak lenni, ha valaki nem is angolos, nehogy már egy-egy menüpontot, meg egy form-on egy-egy mező leírását ne tudja megjegyezni, megérteni, akár szótárral vagy valami nagyon alap kioktatással. Attól meg, hogy nincs lokalizálva, attól még magyarul továbbra is lehet írni bele, a modern OS-ek kiosztástámogatása meg a 20 éve minden releváns platformon támogatott UTF-8 megoldja.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Ebben a topikban releváns. Igaz ezt minden hasonló topikjában a kollégának meg szoktam említeni, hátha egyszer meggyőzöm. Látszik ugyanis, hogy sok a gondja a LaTeX-szel, sokszor elavultság okán. Ez a sima TeX meg nem szokott reklámozva lenni sehol, aki emlegeti is, az is a LaTeX szinonimájaként használja tévesen, amiért nem hibáztatom, mert annyifelé használják így, meg annyi fork van már, hogy nehéz követni annak, aki nincs benne.

Nem tudom, hogy esetleg, csak mint halvány lehetőség, felmerült-e benned, hogy nem akar vanilla texet használni, annak ellenére sem, hogy néha küzd a latexel, mert nem osztja lelkesedésedet a baszakodás iránt? Kérlek nézd meg, hogy itt is mi történik: keresi a karbantartót, mert van egy alapvetően jó megoldás, csak frissíteni kellene (naívan feltételezem, hogy by-and-large még mindig jó, amit csinál az esetek túlnyomó részében, ehhez képest te jössz propagálni egy "megoldást", ami nagyjából úgy hangzik, hogy van valami, de alapvetően nem csinál meg semmit, és azt is szarul, de ha leírom az egész doksit eleve kézzel szótagolva, akkor jó lesz. De legalább független.

Amit azt a ticketing nyavalyát illeti, tényleg nem ismerem. Ez van. Az tényleg kínos, ha magyar célközönségnek készült és annak ellenére nem tud magyarul, bár továbbra se látom, hogy egy ticketing szoftvernek minek kéne magyarnak lenni, ha valaki nem is angolos, nehogy már egy-egy menüpontot, meg egy form-on egy-egy mező leírását ne tudja megjegyezni, megérteni, akár szótárral vagy valami nagyon alap kioktatással. Attól meg, hogy nincs lokalizálva, attól még magyarul továbbra is lehet írni bele, a modern OS-ek kiosztástámogatása meg a 20 éve minden releváns platformon támogatott UTF-8 megoldja.

Nézd, 2022ben egy magyaroknak szóló felület beszéljen már magyarul. Meg milyen megjegyezni? Gizike évente jó esetben 2x ha látja a ticketinget, biztos meg fogja jegyezni. Meg fog majd szótárazni, meg előveszi a kockásfüzetet, amibe le van írva, hogy hova kell kattintani egy fostos tikcethez. Igen, valóban ez a normális*.

*nem

Nem értem miért lenne a TeX baszakodás. Pont azt írom, hogy nem az. Nekem inkább sokkal inkább fordítva rémlik. Azért is ajánlgatom. Persze aki nem akar valamit, az nem akar. Nem értem miért, de legyen.

Ha meg Gizike ticketing rendszert látja évente kétszer, akkor meg minek magyarítani? Ha nagyon minimális dolgokat nem képest megtanulni, akkor minek kezel ilyet? Ne bízzák rá, menjen el takarítani, stb.. Ezzel nem azt mondom, hogy tilos bármit is magyarítani, mert ha van rá erőforrás, akkor miért ne, meg senkit nem vitt el miatta a mentő, de egyes dolgokat nincs sok értelme mindenáron lokalizálni, meg ha véletlenül valami nincs magyarítva, az nem feltétlenül a világ vége annak sem, ha valaki nem profi angolos. Tudom miről szövegelek, sokáig nekem is rohadt szarul ment az angol, főleg a szóbeli része, mivel németes voltam, majdnem ilyen bikicsunáj szint, stb., de ez még 30 éve sem okozott gondot, amikor még kb. semmi nem volt magyarítva az IT-ben, később meg a neten, stb., akkor írásban angol nyelvű szoftvereket használni, angol dokumentációt olvasni, angol parancsokat megjegyezni (DOS, BASIC, Pascal, stb..). Már csak azért sem árt ilyet tudni minimális mértékig, mert az ember könnyen belefut mai napig olyan szolgáltatásba, weboldalba, driverbe, ami nincs magyarítva, és akkor sem kéne, hogy világvége legyen. Nem csak azért, mert léteznek webes gépi fordítók, hanem pár szó erejéig mindenki meg tudja erőltetni magát (login, sing up, search, settings, stb.).

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

> évente kétszer, akkor meg minek magyarítani

mert van 1000 gizike, es nem mind1 hogy evente 2000 alkalommal kell human eroforrast allokalni a ticket megirasara vagy a gizikek kepesek onalloan elvegezni ezt

> nem feltétlenül a világ vége annak sem, ha valaki nem profi angolos
> pár szó erejéig mindenki meg tudja erőltetni magát

gizike felhivott (mivel ticketet sem tud irni), hogy szar a szerver. kiderult, hogy rossz cimre kuldott emailt, es a bounce-ben valami 'server replied: no such user' volt. de gizike is nemetes.

gizike kitorli az osszes angol nyelvu emailt, mert ugyse erti es egyebkent is biztos spam. az amcsik meg mar 3x elkuldtek hogy megnyerte a ceg a tobb millio $-os palyazatot es kuldjenek hozza el a folyositashoz meg par infot. de gizike okos, kitorolte mindet!

(megtortent esemenyek alapjan... bar az egyik gizike gezuka volt)

stb

Ha meg Gizike ticketing rendszert látja évente kétszer, akkor meg minek magyarítani?

Pedig nagyon egyszerű – no sarcasm intended. A ticketing rendszer sok dologra jó, de a #1 tulajdonsága mégis az, hogy minden egyes alkalom, amikor valaki ticketet nyit ahelyett, hogy direktben felhívná a supportot, az növeli a cég profitját (elmaradt költség).

Ha Gizike felhívja az IT-n Gézukát, hogy tessékmán segíteni kitölteni a ticketet, akkor az csökkenti a profitot, és még Gézuka is előbb utóbb lelép a cégtől, mert nem akar userekkel telefonálgatni.

Nem értem miért lenne a TeX baszakodás. Pont azt írom, hogy nem az. Nekem inkább sokkal inkább fordítva rémlik. Azért is ajánlgatom. Persze aki nem akar valamit, az nem akar. Nem értem miért, de legyen.

Értem, hogy te így érzed, de kintről olvasva nem ez szokott lejönni :) Nézd meg ezt:

Én XeTeX alatt a \uselanguage{hungarian} modult használom, ez plain TeX (nem LaTeX) variáns, nincsenek csomagok. Ez ahogy nézem a forrást, csak egy elválasztási modult használ, ami egy Nagy Bence nevű illető hyph-hu.tex megoldásán alapul, és igen korlátozottan működik, és csak az elválasztást oldja meg, azt is sokszor hiányosan, mivel csak egy fél megás szótári rész van benne (~62 ezer bejegyzéssel, de azok nem szavak, hanem több szóra illeszkedő minták), kézzel kell kivételeket hozzáadni a dokumentumban (vagy egy include-olt saját készítésű .tex modulban), pl. \hyphenation{ki-vé-tel bla-bla pél-da} formában vagy a szövegben adok hozzá kézzel eseti \- elválasztási pontokat, pl. ilyen mó\-don, stb... A többiről ez a modul nem gondoskodik, toldalékolás, magyar tipográfiai szabályok (idézőjeltípus, ezt Unicode karakterekkel írom meg, illetve használni kell külön a \frenchspacing parancsot). Cserében viszont elég független az ember így, bár már erre az elválasztási modulra is ráférne egy ráncfelvarrás, mert ahogy nézem, még a régi helyesírási szabályzat szerint van 7+ évvel ezelőttről, azóta megváltozott néhány szó írásmódja, pl. összevissza helyett össze-vissza, ésszerű helyett észszerű, ilyesmik ez az elválasztást is érinthetik.

Kivonatolnám neked, mi látszik ebből kintről

  • vmi sima tex csomagot javasolsz
  • kizárólag elválasztást csinál, semmi más magyar tipográfiát nem
  • azt is szarul
  • szintén régi MHSZ szerint
  • írjál kézzel elválasztást
  • de legalább független :)

... ticketing ...

A ticketing rendszert sima userek használják, azért van rábízva, mert az IT ebben akar kommunikálni, hogy hatékonyan tudjon működni, és ne baszogassák telefonon. És értem, hogy szerinted meg lehet érteni mindenfélét angolul, meg törekszel is rá, szerintem is meg lehet, a userek egy jelentős része nem fog, hiába szeretnél te széllel szemben hugyozni.

ha valaki nem is angolos, nehogy már egy-egy menüpontot, meg egy form-on egy-egy mező leírását ne tudja megjegyezni, megérteni, akár szótárral vagy valami nagyon alap kioktatással

Jaja, évek munkája alatt sem sikerül megtanítani néhány usernek, hogy a monitorra ragasztott stickynote nem megfelelő jelszókezelő megoldás, de ja, tanuljon meg a köcsög szótárazni, ha ticketet akar nyitni. :D

Unicode-ban írod még az idézőjeleket is?

Nem csoda, hiszen nem tudod betölteni rendesen a magyarlatexet még xetex alá se...

(Mindegy, nem arról volt szó, hogy ki mit képtelen használni, hanem arról, hogy amit nem képesek egyesek használni, azt épp ki viszi tovább.)

10-féle lény van:
-- aki ismeri a bináris számrendszert,
-- és amelyik nem.

Az lehet, hogy csak nem forgok olyan körökben, de míg forogtam, akkor is olyan körön kívülieket láttam példának, akik pl. magyarlatex helyett polyglossiát használtak a pdf, utf8 és egyéb modern feature-ök okán. El kell fogadni, hogy a LaTeX, főleg annak a magyar felhasználói tábora iszonyat szűk. Ahogy linuxozni sem linuxoznak túl sokan desktopon. Lehet ez neked nem tetszik, de így van.

Ha viszont szerinted annyira sokan használják, akkor fogjatok össze velük, és tartsátok karban.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Régóta használok LaTeX-et és honosítok is egy csomó mindent, de az aktualizálásába még én sem mertem belevágni. Akármilyen jó is a LaTeX, a fejlesztése rendkívül rendezetlen, és a csomagok forráskódja legtöbbször olvashatatlan halandók számára. Mindenesetre szívesen beszállok, ha van akarat a frissítésére, személy szerint az elválasztás érdekel leginkább, mert babelt már nem használok, de a polyglossia is elvileg a babel elválasztási szótárait használja.

Egy friss elválasztási szótár tényleg jól jönne, viszont ez nem a magyar.ldf része.
Az elválasztási mintákat a hyph-hu.tex fájl tartalmazza, amit Nagy Bence csinált, kb. 11 évvel ezelőtt. Ez természetesen az MHSz. 12 változásait nem tartalmazza.

Egyébként az elválasztást sajnos mindenképp át kell nézni kézzel, ha igényes munkát akarsz kiadnia a kezedből, mert még azonos szóalak mellet is lehet más az elválasztás, a jelentéstartalomtól függően. Pl.: meg-int (valakit) vagy me-gint (esik az eső).
És persze vannak még az olyan hitbéli kérdések, mint hogy felismerünk-e még egy idegen eredetű szóösszetételt, vagy szótagolunk: foto-gráfia vs. fotog-ráfia, illetve vagyunk-e oly igénytelenek, hogy a magyar helyesírás szerinti Wa-shington elválasztást megengedjük, vagy teszünk a szabályzatra, és a Wash-ington formát látnánk szívesebben, esetleg a szabályzattisztelő lelküket és angol nyelvérzékünket is megnyugtatva, csak a Washing-ton elválasztást engedjük meg.

A jó hír, hogy az elválasztási döntések kinyerhetők a TeX-ből. Régebben a pdflatex-es időkben a findhyph programot használtam, manapság a lua-check-hyphen csomaggal dolgozom. Ez utóbbi különösen hasznos eszköz.

Ami talán a magyar.ldf hatáskörébe tartozna, (de ebben sem vagyok biztos, ráadásul kérdés, hogy melyik betűtípusok támogatják) az a f* ligatúrák esetenkénti tiltása.
Elvileg ha az fi betűpár magában marad egy elválasztás miatt, pl. fi-atal vagy barom-fi, akkor az fi betűpár nem képez ligatúrát. Bizonyos fontokban láttam erre a helyzetre egy keskeny f betűt, ami nem lóg bele az i betű pontjába.
Amihez pedig már nyelvi elemzés kellene: ugyancsak nem kellene ligatúrát használni, ha a betűkapcsolat szóösszetétel határán van, pl.: zsiráfidomár vagy golfjátékos. Ezekben a szavakban is a keskeny f lenne a megoldás.

Ez meg a másik, jó is, hogy írod. Automatikában amúgy sem érdemes bízni, nem csak az elválasztás miatt, hanem pl. amúgy is át kell olvasni a készre tördelt anyagot, mert vbox meg akármi miatt lehet sortúllógás, meg egyéb bug. Ha meg az ember átnézi, akkor az elválasztást is nézi. Ez a fi-atal esetén érdekes ligatúra meg olyan apróság, amit csak úgyis kézileg lehet kivédeni. A betűtípus nem érdekes, a modern TeX/LaTeX variánsok ezt tudják, hogy OpenType fontnál ligatúrás kiegészítést be/ki kapcsolni, meg tuti, hogy szavanként is letiltható esetileg speciális kerning közbeszúrásával.

A nyelv nem probléma, mert ha magyar nyelv van beállítva a fejlécben, akkor mehet a Wa-shing-ton elválasztás. Angolul nyilván nem áll meg, de az angol nyelvű dokumentumoknál érdekes, és akkor a magyar.ldf meg a többi úgyse használható, eleve a tipográfiai szabályok is megváltoznak (pl. más kötőjel, másfajta idézőjelek, stb.), de erről meg gondoskodik az angol nyelvi beállítás a fejlécben (vagy annak hiánya, mert ha a magyar nyelv nincs definiálva, akkor az amerikai angol az alapértelmezés).

Az összetételi határon lévő elég szubjektív, ahány embert kérdezel, annyiféle preferencia lesz erre. Én simán engedném ilyenkor is a ligatúrát, nem tudok olyan szabályról, ami ezt ilyen esetben kifejezetten tiltaná, de megértem azt is, akit ez zavar.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Sziasztok!

Én (pts) írtam 2003-ban és 2004-ben a magyar.ldf 1.5-ös verzióját (és később még néhány hibát javítottam benne), a korábbi verziókat mások írták. Az utóbbi években nem foglalkoztam vele. Innen tölthető le a dokumentáció, a magyar.ldf és egyéb kiegészítő fájlok a LaTeX magyarításához: https://math.bme.hu/latex/ . (Bizonyos böngésző- és adblock-beállítások megakadályozhatják a letöltést a linkre kattintva. Ekkor másold be az URL-t egy új tabba, vagy töltsd le pl. wget-tel vagy curl-lel.) Az általam írt magyar.ldf nekem a TeX Live 2019-beli latex és pdflatex parancsokkal működött utoljára, valahol a Tex Live 2020-astól kezdve valószínűleg már nem megy (mert akkoriban változott a \@begindocumenthook a LaTeX-ben, és erre már nem készítettem fel). pdflatex mellett lualatex-hel is működésre bírható a uni8 (https://github.com/pts/latex-uni8) kiegészítő csomaggal. Ha jól emlékszem, a TeX Live-ban a Nagy Bence által írt magyar elválasztás van, amely a leggyakoribb összetett szavakat is jól tudja, és ez alapból működik is a fenti magyar.ldf-fel.

Jelenleg a régi e-mail-címem nem működik, de a HUP-on keresztül (elvileg) lehet az új címemre küldeni üzenetet, vagy erre a hozzászólásra is lehet válaszolni. Még nem döntöttem el, mennyit időt tudok szánni a LaTeX-es fejlesztésekre és javításokra.

Üdv:

pts

Komolyan aggódtunk.

Néhányan segítenénk ám szívesen a fejlesztésekben, a magyar.ldf-hez javaslatokkal, megoldásokkal.
Eddig jómagam rengeteg időt köszönhet eddigi tevékenységednek.

Kérdés az, hogy az információ megosztása milyen úton történjen.

10-féle lény van:
-- aki ismeri a bináris számrendszert,
-- és amelyik nem.

Már írjuk is a bővítési javaslatokat...

Még egy hét és megvan. Levélben küldöm.

A kódod elég sok sorból áll ahhoz, hogy egy újonc minden részletében eligazodjon benne, tudja, mi miért került bele, tehát egy teljes átadás nem egyik napról a másikra menne. Szerintem mindenképpen maradj benne, ha másképp nem, akkor úgy, hogy a beszálló fejlesztők útját segíted tájékozódni. (A többit tényleg levélben)

10-féle lény van:
-- aki ismeri a bináris számrendszert,
-- és amelyik nem.