Helyesírásellenőrzés

Sewastok!

Adott egy Ubuntu 6.06-os, amin LaTeX doksit írok, és fájlon szeretnék helyesírásellenörzőt futtatni. Először a Gnome-os szövegszerkesztőn keresztül próbálom elindítani, de baromi lassú, és túlterheli a gépet, telepakolja a memóriát majd szépen lassan a swapot is. Utána próbáltam terminálból, ahogy anno is csináltam, először ispell-el: nem kezelte rendesen az ékezetes szavakat. Utána aspell, ami már kezelte az ékezeteket, de a szótára meglehetősen hiányos, és az összetett szavakat nem kezeli.
Kb. egy fél évvel ezelőtt, mikor még SourceMage volt a gépen hibátlanul tudtam ellenőrizni .tex fájlokat ispellel. Tud valaki valamilyen megoldást? Szükségem lenne "működő" LaTeX doksikra!

3000 megtekintés

hunspell környékén nézz körül. az elvileg egy ispellel API/ABI szinten kompatibilsm de sokkal okosabb dolog, és véletlen jól tud magyarul. openoffice ezt használja manapság

0 szavazat

A hozzászóláshoz be kell jelentkezni

Feltettem és próbáltagom, de semmi eredmény. :( Megadtam neki a myspell-es szótárfájlok abszotúl útvonalát a -d kapcsoló után, de azt mondja, hogy "Nem lehet megnyitni a ragozási vagy a szótárfájlt."

0 szavazat

A hozzászóláshoz be kell jelentkezni

sry, nekem nincsen (fedorázom, de ooo-t nem használok rajta és csak azzal megy fel, vagy külön forgatva, és nem csináltam csomagot belőle... csak gondoltam, te még nem hallotál róla (mert én még csak hallottam róla :) és kis utáanézéssel találsz mgoldást a problémádra) mind1

0 szavazat

A hozzászóláshoz be kell jelentkezni

Sikerült hunspellel ellenőrizni. Az első általa észlelt hibás szó a "bevezetés". Azt hiszem ez is felejtős. :(

0 szavazat

A hozzászóláshoz be kell jelentkezni

LoL! pedig állítólag nagyon jó/okos. lehet csak a szótárad régi/sz*r. Mármint amit a siztróba csomagoltak. Amúgy: egy ilyen ksi hülyeség még ne keserítsen el. False positive-ok mindig lesznek minden ilyen ellenőrzében, de összességében lehet hasznos, jó. SZVSZ legalábbis

0 szavazat

A hozzászóláshoz be kell jelentkezni

0.99.4-es myspell van fent, Ubuntu csomagból. Nem keserít el, csak baromira zavar, hogy 3 helyesírásellenörző sem képes megbírkózni a feladattal. Anno pont azért váltottam Ubuntura, mert nem kell bíbelődnöm a beállításokkal, karbantartással. És most, hogy nekiállnék sulis anyagokat irogatni, egy lényeges feladat nem megy. A LaTeX-ot pedig nem szívesen adom fel. Úgy tűnik egyébként, hogy az ispell csak terminálon keresztül akadékoskodik, a szövegszerkesztőből indítve megy, csak baromi lassan, és egy-egy szónál képes perceket keresni. Arról nem is beszélve, hogy a rendelkezésre álló memóriát teljesen megtölti, és swapol elég keményen.

0 szavazat

A hozzászóláshoz be kell jelentkezni

myspell-hu csomag megvan?

Nem lehet, hogy a szöveged utf-8 kódolása okozza a problémát?
(Nekem itt Debian alatt működik, de úgy tudom, Ubuntu alatt
unicode van.)

0 szavazat

A hozzászóláshoz be kell jelentkezni

myspell-hu csomag megvan?

Nem lehet, hogy a szöveged utf-8 kódolása okozza a problémát?
(Nekem itt Debian alatt működik, de úgy tudom, Ubuntu alatt
unicode van.)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Myspell-hu fent van, azzal a szótárral próbáltam a hunspell-t is. És igen, UTF-8-as a kódolás.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez nekem is előjön folyamatosan ... :)
nekem a "következő" szó amit folyton hibásnak talál de helyette is csak ugyanazt ajanlja.
Emiatt nemis nagyon zavarkolódom miatta. Igaz nálam csa k
egy helyen jön elő... :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nekem sajnos állandóan, és az összetett szavakat sem képes normálisan kezelni. :(

0 szavazat

A hozzászóláshoz be kell jelentkezni

Igen, az a másik hülyesége :(

0 szavazat

A hozzászóláshoz be kell jelentkezni

Gyerekek, nem tudom mit bénáztok, de nekem a legújabb hunspell és legújabb szótár van, a "következő" szót természetesen helyesnek ismeri fel, és az összetett szavakat is nagyon jól kezeli, olyasmi finomságokat is ismer, mint például hogy a többszörösen összetett szavakat egybe írjuk 6 szótagig (a ragozatlan alak szótagszáma számít), de kötőjellel 7 szótagtól. Így például a téma nyitó "helyesírásellenőrzés" szavát is helyesen hibásnak jelzi, hiszen többszörösen összetett, és eléri a 7 szótagot, és a javításként a megfelelő helyre beszúrja a kötőjelet, hiszen "helyesírás-ellenőrzés" a helyes írásmód.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Szerintem a magyarispell lesz a te barátod. Az oldalon szép magyar nyelvű dokumentációt is találsz hozzá.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hmmm, eleve helyesen írni? Igaz, hogy egyszer igényel néminemű idő-ráfordítást, de onnantól teljesen platformfüggetlen, garantáltan korrekt, nem fogyaszt sem memóriát, sem cpu-kapacitást. Ja, és még a 'Sewastok'-ot is képes 'Szevasztok'-ra javítani :) ...
(Jut is eszembe: ha a beszéd és az írás a gondolkodást tükrözi kifelé, akkor mikorra várhatóak az első helyes-gondolkodás-ellenőrzők?)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszönöm a bizalmat. :) Elsősorban azért kell, hogy a véletlenül elgépelt szavakat kiszűrje. Egy 70 oldalas TDK dolgozat esetében idő szempontjából egyszerűbb helyesírásellenőrzőt alkalmazni, mint átolvasni jópárszor. De ha nem gond elküldöm majd Neked, hogy Te ellenőrizd, az sem igényel cpu időt. :) És köszi az építő hozzászólást. :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Csak a tisztánlátás kedvéért: a hunspell-nél nem létezik jobb helyesírás-ellenőrző.
A magyarispell pedig a hunspell-hez használandó magyar szótárerőforrás. Mivel az ubuntuban elég régi van, érdemes letölteni a honlapról a legújabbat és azt tenni a helyére.
Nálam minden jól működik (gentoo). Az Openoffice-hoz az utf8-ast, konzolon a latin2-est kell használni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Köszönöm! Amint hazaértem kipróbálom!

0 szavazat

A hozzászóláshoz be kell jelentkezni

> konzolon a latin2-est kell használni.
Nem, konzolon azt kell használni, ami passzol a rendszered karakterkészletéhez. Tudtommal manapság már az ubuntu is utf8-at használ alapból.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Kipróbáltam a hunspell-t az új, UTF-8-as szótárfájlokkal. Egy .tex fájlt akartam ellenőrizni, ezt kaptam:

"UTF-8 encoding error. Missing continuation byte in 7. character position: Bevezet"

0 szavazat

A hozzászóláshoz be kell jelentkezni

Milyen encodingban a LaTeX-fájlod? Ha nem UTF8-ban, akkor előbb át kéne kódolni, nem gondolod? Ha mondjuk iso-8859-2-ben van, akkor

$ cat valami.tex | iconv -f iso-8859-2 -t utf-8 | hunspell -l -t | sort | uniq -c >rosszul_irt_szavak.txt

0 szavazat

A hozzászóláshoz be kell jelentkezni

UTF-8-ban van. Ezt azért nem felejtettem el. :) A fájlt Ubuntu alatt hoztam létre.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Használd az 1.1.4-es Hunspellt, amiben már van UTF-8 tokenizálás.

0 szavazat

A hozzászóláshoz be kell jelentkezni

3 hozzászólással feljebb írtam, hogy azzal adja ezt a hibát.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Akkor ezt kell látnod, ha elindítod paraméter nélkül:

Hunspell 1.1.4 - Magyar 1.1.1

És ha ezt látod, működni is fog. (De csak UTF-8-as állományokon
az UTF-8-as szótárral!)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ugyanezt adja vissza, ha paraméterek nélkül indítom. Tovább próbálgattam terminálban, és észrevettem, hogy az "ő" betűk megjelenítésével van leginkábbgondja, azaz egy "?~Q" karakterhármassal intézi el a dolgot. Ezen kívül sokszor előfordul, hogy szavak összecsűsznak az ellenőrzés során, de persze ezeket külön kezeli, csak az olvashatóság romlik. Ha gondolod küldhetek egy e-mail címre képernyőképet.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A tokenizálási gond ezek szerint megoldódott. A konzolos felület régi hiányossága, hogy rossz helyen jeleníti meg az UTF-8-as szövegben a kiemelést (a hibás szót). A Hunspell 1.1.5b ezt javítja (hosszabb soroknál még lehetnek hibák). A címem: nemeth@OOo. Köszönöm a hibajelzést!

0 szavazat

A hozzászóláshoz be kell jelentkezni

> az "ő" betűk megjelenítésével van leginkábbgondja, azaz egy "?~Q" karakterhármassal intézi el a dolgot.

Ezt az okozza, hogy a libncurses-hez van linkelve a libncursesw helyett. Ha megbütykölöd hogy az utóbbihoz linkeljen, akkor már jól fogja megjeleníteni az ő betűt. Más kérdés, hogy ekkor is vannak megjelenítési problémák a teljes képernyős ncurses felületen, amiről Németh Laci is írt hogy tud és folyamatban a javítás.

Egyébként én személy szerint azzal a megoldással szimpatizálok, hogy "hunspell -l" a fájlra, aztán sort|uniq, így kapok egy listát egyben az összes hibásnak vélt szóról, amit átfutok szemmel.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az "ő" karakterek megjelenítésének problémája megoldódott. Köszönöm! :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

> az "ő" betűk megjelenítésével van leginkábbgondja, azaz egy "?~Q" karakterhármassal intézi el a dolgot

Illetve most jutott eszembe, hogy nemcsak az ncursesw okozhatja (amit az előbb írtam), hanem az is, ha magát a hunspell programot nem utf8 locale beállításokkal futtatod.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Friss hozzászólások

_NEKED_ kényelmes, de ez nem… 2025-08-09T19:27:09+0200
Azt hiszem nem anyázok a… 2025-08-09T19:19:39+0200
Az egy dolog hogy gyógyszert… 2025-08-09T19:18:28+0200
Az egészségbiztosító mikor… 2025-08-09T19:18:02+0200
Alpári paraszt stílusú. 2025-08-09T19:15:46+0200
Gyors közvéleménykutatás a… 2025-08-09T19:15:38+0200
A HUP nem py, hanem php :D 2025-08-09T19:11:45+0200
Te jössz mindig a… 2025-08-09T19:10:33+0200
kiprobaltam, igy 27 t/s-el… 2025-08-09T18:48:57+0200
nem tudsz olvasni :) 2025-08-09T18:55:11+0200

Helyesírásellenőrzés

Hozzászólások