Helyesírásellenőrzés

Fórumok

Sewastok!

Adott egy Ubuntu 6.06-os, amin LaTeX doksit írok, és fájlon szeretnék helyesírásellenörzőt futtatni. Először a Gnome-os szövegszerkesztőn keresztül próbálom elindítani, de baromi lassú, és túlterheli a gépet, telepakolja a memóriát majd szépen lassan a swapot is. Utána próbáltam terminálból, ahogy anno is csináltam, először ispell-el: nem kezelte rendesen az ékezetes szavakat. Utána aspell, ami már kezelte az ékezeteket, de a szótára meglehetősen hiányos, és az összetett szavakat nem kezeli.
Kb. egy fél évvel ezelőtt, mikor még SourceMage volt a gépen hibátlanul tudtam ellenőrizni .tex fájlokat ispellel. Tud valaki valamilyen megoldást? Szükségem lenne "működő" LaTeX doksikra!

Hozzászólások

hunspell környékén nézz körül. az elvileg egy ispellel API/ABI szinten kompatibilsm de sokkal okosabb dolog, és véletlen jól tud magyarul. openoffice ezt használja manapság

sry, nekem nincsen (fedorázom, de ooo-t nem használok rajta és csak azzal megy fel, vagy külön forgatva, és nem csináltam csomagot belőle... csak gondoltam, te még nem hallotál róla (mert én még csak hallottam róla :) és kis utáanézéssel találsz mgoldást a problémádra) mind1

LoL! pedig állítólag nagyon jó/okos. lehet csak a szótárad régi/sz*r. Mármint amit a siztróba csomagoltak. Amúgy: egy ilyen ksi hülyeség még ne keserítsen el. False positive-ok mindig lesznek minden ilyen ellenőrzében, de összességében lehet hasznos, jó. SZVSZ legalábbis

0.99.4-es myspell van fent, Ubuntu csomagból. Nem keserít el, csak baromira zavar, hogy 3 helyesírásellenörző sem képes megbírkózni a feladattal. Anno pont azért váltottam Ubuntura, mert nem kell bíbelődnöm a beállításokkal, karbantartással. És most, hogy nekiállnék sulis anyagokat irogatni, egy lényeges feladat nem megy. A LaTeX-ot pedig nem szívesen adom fel. Úgy tűnik egyébként, hogy az ispell csak terminálon keresztül akadékoskodik, a szövegszerkesztőből indítve megy, csak baromi lassan, és egy-egy szónál képes perceket keresni. Arról nem is beszélve, hogy a rendelkezésre álló memóriát teljesen megtölti, és swapol elég keményen.

Gyerekek, nem tudom mit bénáztok, de nekem a legújabb hunspell és legújabb szótár van, a "következő" szót természetesen helyesnek ismeri fel, és az összetett szavakat is nagyon jól kezeli, olyasmi finomságokat is ismer, mint például hogy a többszörösen összetett szavakat egybe írjuk 6 szótagig (a ragozatlan alak szótagszáma számít), de kötőjellel 7 szótagtól. Így például a téma nyitó "helyesírásellenőrzés" szavát is helyesen hibásnak jelzi, hiszen többszörösen összetett, és eléri a 7 szótagot, és a javításként a megfelelő helyre beszúrja a kötőjelet, hiszen "helyesírás-ellenőrzés" a helyes írásmód.

Hmmm, eleve helyesen írni? Igaz, hogy egyszer igényel néminemű idő-ráfordítást, de onnantól teljesen platformfüggetlen, garantáltan korrekt, nem fogyaszt sem memóriát, sem cpu-kapacitást. Ja, és még a 'Sewastok'-ot is képes 'Szevasztok'-ra javítani :) ...
(Jut is eszembe: ha a beszéd és az írás a gondolkodást tükrözi kifelé, akkor mikorra várhatóak az első helyes-gondolkodás-ellenőrzők?)

Köszönöm a bizalmat. :) Elsősorban azért kell, hogy a véletlenül elgépelt szavakat kiszűrje. Egy 70 oldalas TDK dolgozat esetében idő szempontjából egyszerűbb helyesírásellenőrzőt alkalmazni, mint átolvasni jópárszor. De ha nem gond elküldöm majd Neked, hogy Te ellenőrizd, az sem igényel cpu időt. :) És köszi az építő hozzászólást. :)

Csak a tisztánlátás kedvéért: a hunspell-nél nem létezik jobb helyesírás-ellenőrző.
A magyarispell pedig a hunspell-hez használandó magyar szótárerőforrás. Mivel az ubuntuban elég régi van, érdemes letölteni a honlapról a legújabbat és azt tenni a helyére.
Nálam minden jól működik (gentoo). Az Openoffice-hoz az utf8-ast, konzolon a latin2-est kell használni.

Ugyanezt adja vissza, ha paraméterek nélkül indítom. Tovább próbálgattam terminálban, és észrevettem, hogy az "ő" betűk megjelenítésével van leginkábbgondja, azaz egy "?~Q" karakterhármassal intézi el a dolgot. Ezen kívül sokszor előfordul, hogy szavak összecsűsznak az ellenőrzés során, de persze ezeket külön kezeli, csak az olvashatóság romlik. Ha gondolod küldhetek egy e-mail címre képernyőképet.

A tokenizálási gond ezek szerint megoldódott. A konzolos felület régi hiányossága, hogy rossz helyen jeleníti meg az UTF-8-as szövegben a kiemelést (a hibás szót). A Hunspell 1.1.5b ezt javítja (hosszabb soroknál még lehetnek hibák). A címem: nemeth@OOo. Köszönöm a hibajelzést!

> az "ő" betűk megjelenítésével van leginkábbgondja, azaz egy "?~Q" karakterhármassal intézi el a dolgot.

Ezt az okozza, hogy a libncurses-hez van linkelve a libncursesw helyett. Ha megbütykölöd hogy az utóbbihoz linkeljen, akkor már jól fogja megjeleníteni az ő betűt. Más kérdés, hogy ekkor is vannak megjelenítési problémák a teljes képernyős ncurses felületen, amiről Németh Laci is írt hogy tud és folyamatban a javítás.

Egyébként én személy szerint azzal a megoldással szimpatizálok, hogy "hunspell -l" a fájlra, aztán sort|uniq, így kapok egy listát egyben az összes hibásnak vélt szóról, amit átfutok szemmel.

> az "ő" betűk megjelenítésével van leginkábbgondja, azaz egy "?~Q" karakterhármassal intézi el a dolgot

Illetve most jutott eszembe, hogy nemcsak az ncursesw okozhatja (amit az előbb írtam), hanem az is, ha magát a hunspell programot nem utf8 locale beállításokkal futtatod.