Latexhez elválasztómodul, meg mellé txt fájlhoz helyesíráselemző

Fórumok

Sziasztok.

Nagyobb terjedelmű írást készülök alkotni, természetesen kisebb alfejezetből összerakva, saját scriptekkel tex forrássá alakítgatva a nyers plaintext-eket.

Arra gondoltam, hogy valamilyen elütésellenőrző programmal végigfuttatnám a naponta írt kis dolgaimat (aspell, ispell), majd miután minden készen áll és a tex forráskód is megvan, a fődokumentumba való behíváskor a latex az elválasztómodult is rendesen használja.

Részletesebben:
A latex fordító most is rendesen használja a magyar elválasztómodult, de nem tudom, hogy az MTA által kiadott melyik verziót használja.
Tudom, hogy létezik egy MTA által kiadott és karbantartott nyelvhelyesség-ellenőrző is (nem csak ispell és aspell-cucc), de ezekről sem tudok szinte semmit. Állítólag az MTA nem adta oda a teljes szókészletet a microsoftnak --- meg hasonlókat olvastam róla, nem emlékszem már.

Tehát szerintetek hol érdemes elindulnom, ha azt akarom, hogy mind a latex elválasztórendszere, mind az ispell/aspell magyar helyesíráselemzője menjen nálam BASH alatt? (open- meg libreofice használata kizárt...)

-----------

[elvalami]$ aspell --version
@(#) International Ispell Version 3.1.20 (but really Aspell 0.60.6)
a[elvalami]$ ispell
@(#) International Ispell Version 3.2.06 08/01/01
word: ^C
a[elvalami]$ latex --version
pdfeTeX 3.141592-1.21a-2.2 (Web2C 7.5.4)
kpathsea version 3.5.4

Hozzászólások

A LaTeX jelenleg legjobb magyarítása a BME-s LaTeX oldaltól érhető el, http://math.bme.hu/latex
ha ezt jól beállítod, akkor a magyar elválasztás, számozások, kereszthivatkozások jól fognak működni (tud automatikus toldalékolást is,
pl. ha x-et kifejezzük a 26-odik fejezetben található (7) egyenletből, és figyelembe vesszük (8)-at is ).
Érdemes utf-8 vagy latin-2 kódolású szöveget beírni (nem \'\i gy \'\i runk magyarul).

Helyesírás: aspell magyarul felejtős, ispell (a magyarispell csomag telepítésével) egész jó, de elavult, hunspell javasolt (bár vannak nyűgjei konzolon, de az csak a megjelenítés).

Igen, azt hiszem a BMEmath-ról töltögettem anno a latexet (azóta tgz-ben magamnak bővítgetem). Megnézem, miket bővítettem, majd letöltöm megint és begyógyítom stíluslapjaimat az újba.

A hunspell valami új lehet, megnézegetem.
Az aspell rosszaságáról már hallottam, az ispell elavultságáról még nem.

Köß

UI:

Nekem mindegy, hogy {\'\i}rok, milyen k\'odol\'assal, oda-vissza tudok alak{\'\i}tani\dots \ \ \ \smile

---
--- A gond akkor van, ha látszólag minden működik. ---
---

A jó magyar elválasztáshoz az alábbiak kellenek:

* magyar.ldf (a http://www.math.bme.hu/latex -ről)
* huhyphn (sudo apt-get install texlive-lang-hungarian)
* \usepackage[magyar]{babel}

Ha a \usepackage[magyar]{babel} warningol (a konzolon vagy a .log fájlban), hogy a magyar elválasztást (hyphenation) nem ismeri, akkor a huhyphn telepítése nem volt sikeres.

Az alábbiakat próbáld meg elválasztani: \showhyphens{árvíztűrő meggyültetvény}

Ekkor jó: ár-víz-tű-rő meggy-ül-tet-vény

Nálam ezek mennek a preambulumba:


\usepackage[T1]{fontenc}
%% \usepackage[latin2]{inputenc}
\usepackage[utf8]{inputenc}
\usepackage[magyar]{babel}
\frenchspacing

Az inputenc változhat attól függően, hogy a kenyérszöveg latin2 vagy utf8, az elválasztás/ellenőrzés meg ahogy előttem leírták. (Hasznosnak szánt subs)

Nos, most élesedett be a helyzet.
Megtelepedett a hunspell, mert az aspell nem megy, hiába csinálomm vele ezt, amit itt írnak le:
http://www.bradleymedia.org/aspell

a hunspell ezt énekli nekem:

a[jak_fogalma]$ hunspell --version
@(#) International Ispell Version 3.2.06 (but really Hunspell 1.2.9)
Copyright (C) 2002-2008 Németh László. Licenc: MPL/GPL/LGPL.
Az OpenOffice.org Myspell programkönyvtárán alapul.
MySpell copyright (C) Kevin Hendricks, 2001-2002, Licenc: BSD.
Ez egy szabad szoftver: lásd a forráskódot a licencfeltételekről.
NINCS garancia, még az eladhatóságra vagy valamely célra való
alkalmazhatóságra sem.

a[jak_fogalma]$ hunspell ./jakfogalma.tex
Can't open affix or dictionary files for dictionary named "hu_HU".
a[jak_fogalma]$

Elkezdek manualokat vadászni...

--- A gond akkor van, ha látszólag minden működik. ---
---

Ismét egy gond:

Az elválasztó rendszer a latexben nem akarja ezeket elválasztani a sor végén:

lehet-e
stratégiai- vagy

Szóval szerintetek írjam ezeket be úgy, hogy erőltessem az elválasztásukat ezeknek?

\hyphenation{le-het-e,stra-té-giai-}

vagy esetleg így?

le\-het-e
stra\-té\-giai-

Rengeteg ilyen szavam van, biztos van valami automatika a latexben, ami lefőzi a kávét is...
Vagy én írom rosszul a kötőjeleket, kéne egy space is?

---
--- A gond akkor van, ha látszólag minden működik. ---
---

Á, látom már 6 éve is ugyanezekkel a témákkal kínlódtál, LaTeX weboldalról telepítése, bővítgetése, karakterkódolás, elválasztás :D Nem is tudtam, hogy ilyen régi motoros vagy, én csak 2014 óta foglalkozok vele.

Nem csak a szó végén problémás a kötőjel, hanem akkor is, ha szó elején vagy közepén áll, ilyenkor a TeX motor úgy kezeli, hogy te kézzel adtál meg elválasztást, és ezáltal kivételes lett a szó (nem lehet szótár vagy szabály alapján automatikusan elválasztani). Ha annyira zavar ez a kötőjeles téma, akkor a kötőjeles szavaknál a kötőjel helyett \hyp{} szekvenciát írj (ez is sima kötőjelként jelenik meg), így elválasztja a kötőjelet tartalmazó szavakat is. Azt már tisztáztuk, hogy az -e végződésű kérdezős szavakat nem választjuk el, mert a sor elején az „e” hülyén mutatna tipográfiailag (helyesírás megengedné). A „lehet-e” tipográfiailag abszolút elválaszthatatlan (helyesírásilag lehetséges két ponton is), az „le-” nem néz ki jól sor végén, pláne, hogy az l egy vékony betű, és emiatt és az alakja miatt is az e-t egyébként is közelebb kell hozzá húzni normális kerningnél.

Egyébként ezt a TeX-es kötőjeles mizériát a modern TeX-forkokban valóban javítani kéne, mert nem csak téged idegesít, hanem még jó pár embert, plusz nem csak a magyar nyelv érintett.

Persze a britek gyorsan megoldják: nem sorkizárnak, nem választanak el. Sorkizárás csak könyvekben (és egyes újságokban van), elválasztás meg csak könyvekben (de újságban, meg egész komoly nyomdai anyagokban sincs). Náluk ez a szokás, nem bonyolítják az életüket. Az angol szavak úgyis rövidek, nem nagyon igényelnek elválasztást, a sorkizárás meg megint azért nem olyan fontos, mert nincsenek hosszú szavak, ahol igazán csúnyán mutatna.

„Pár marék nerd-et leszámítva kutyát se érdekel már 2016-ban a Linux. Persze, a Schönherz koliban biztos lehet villogni vele, de el kéne fogadni, ez már egy teljesen halott platform. Hagyjuk meg szervergépnek…” Aron1988@PH Fórum

2002 óta foglalkozom tex-hel, akkor BeOS-en a BeTeX editorral és a gobe-bal írtam a forráskódot, utóbbi kimenetében extra attribként a kiemelt szavak is ott voltak pirossal... Linuxon nincs olyan extraattrib, mint beos-en. Itt más van.

Rendben, a kritikus szavakat egyenként kikeresem és tex-esítem...