Esetleges hunspell-hiba

Fórumok

Sziasztok.

TexStudioban leírtam egy szót hibásan, majd javaslatot kértem tőle javításra.
A szó: "őzintén". (Őszintén helyett.)

Ezek a szavak jöttek ki:
,,Szintén, őszintén őzintőén, őzpintén, őzinúén, őzináén, őzingén, őzindén, őzindőn.''

Kérdésem az, hogy ezmiez?
Zavarodott már össze nálatok a szótárállomány GUI-s programoknál -- vagy benéztem valami banálisat?

Vagy beolvas nekem a TexStudio 16 nyelvet és azokat írja le fonetikusan?

Libreoffice-nél ugyanez a helyzet. Megnéztem, a standard mellett a technical szótárállomány is be van töltve.

----------

Parancssorban végzem inkább az ellenőrzést, ott nem észleltem semmi anomáliát:

cat ellenorizendo.tex | hunspell -p ./full.szotar -d hu_HU,en_EN -t -l > hibalista.log

Hozzászólások

Most csak ezért feltettem egy ubuntura, ugyanezeket írja.

Legutóbb nekem is volt hasonló gondom, de Archon Firefox 96 vagy 97 alatt, már nem is emlékszem. Nem ismert fel egy csoó szót, meg hülyeségeket ajánlott. A lényeg, hogy a hunspell van eltörve bizonyos alkalmazásokban, próbáld meg mindkettőt frissíteni, legújabb verziós hunspell és az alkalmazásból is a legújabb verzió.

The world runs on Excel spreadsheets. (Dylan Beattie)

Kizárt, hogy a hunspell lenne a ludas, lefuttattam parancssorban:

└─# cat teszt.txt
hogyan őzintén

└─# cat teszt.txt | hunspell -p ./full.szotar -d hu_HU,en_EN -t -l
őzintén

Ajánlásokat ugyan nem írattam ki, de jól látható: jelzi a hibás szót, tehát rendesen működik.
---------
Firefox mindig a legújabb, libreoffice nem (de nem is használom semmire TeX mellett).
A TexStudio is a legújabb, azt forráskódból raktam fel.
Könnyen előfordulhat, hogy a "szavak ajánlása az elrontott helyett" nevű modul, program vagy függvényhalmaz megtanult ork nyelven.

Lila gőzöm sincs, mi lehet itt.

10-féle lény van:
-- aki ismeri a bináris számrendszert,
-- és amelyik nem.

Igen, CLI-ben nekem is működött, de GUI-s alkalmazásokban lehet belőle gikszer.

Én egyébként TeXstudio helyett vim-et használok, zathura-val. Bekonfigolt gyorsbillentyűre megy a fordítás, a pdf-et meg zathura-ban nyitom meg, ami esetleges újrafordításkor automatikusan érzékeli, hogy megváltozott a fájl, újrarendereli. Még syntex támogatása is van a zathurának, de azt nem konfigoltam be, azzal azt nyered, hogy a pdf-néző odateker ahhoz a részhez a renderelésben, ami annak a kódnak felel meg, amit épp szerkesztesz a szövegszerkesztőben. Bár én már a LaTeX-et, TeX-et, XeTeX-et sem nagyon használom, egyre riktábban volt rá szükségem, mióta külföldön élek, nem kellett ilyen hivatalos magyar litániákat, beadványokat, levelezéseket, önéletrajzokat, iskolai beadandókat írni, így ott porosodnak a háttértáron a XeTeX sablonjaim. LibreOffice-t is elfelejtettem már sok éve feltenni, jelenleg a TexLive bin/minimal sincs fent most Archon.

A TeXstudio se rossz, csak bloat, azt nagyon régen használtam, utoljára valami 7+ éve, mikor kezdőbb LaTeX-es voltam. A bloaton nem csak a memóriafoglalást értem, hanem a függőségeket is, ami azt jelenti, hogy minél több függősége van valaminak, annál nagyobb az esélye, hogy frissítéskor valami eltörik, és lásd a Firefox esetét, meg a te esetedet, el is tört.

The world runs on Excel spreadsheets. (Dylan Beattie)

A TexStudiot eleinte én is elleneztem, a telepakolt extráival együtt. Azonban rá kellett ébrednem, hogy ha megy minden parancssorban, egy idő után igényem támad nagyon durva hosszú szövegek esetében egy összetettebb GUI-ra. A TexMaker volt előtte a max, ameddig elmentem, meg a Gummi.

Mostanában egyre sűrűbben használom a TexStudiot, a TexMakert kiszorította.

Azonban a legfőbb editor még mindig az mcedit és a Geany.

---------

Amúgy a hunspellt nemrég lefuttattam paraméterek nélkül, és megjelenik a rossz ajánlás:

hogyan őzintén

 0: őszintén
 1: szintén
 2: őzintőén
 3: őzpintén
 4: őzinúén
 5: őzintés
 6: őzináén
 7: őzingén
 8: őzindén
 9: őzintőn

Találtam egy könnyebb olvasmányt a délutáni kávémhoz, hasonló dolgokról szól a megosztás:

https://stackoverflow.com/questions/56026550/how-to-use-hunspell-packag…

10-féle lény van:
-- aki ismeri a bináris számrendszert,
-- és amelyik nem.

Megnéztem, a fentiek futtatásakor nem volt fent a hunspell csomag csak a hunspell-hu. Nem is volt parancssoros hunspellem, a texstudio és a libreoffice valami sajátot használhat.

Ez valami névadási, vagy csomagcsoportosítási probléma, lehet a te disztród összecsomagolja a hunspell és hunspell-hu modulokat. Az egyik az maga az engine, a másik a szótári rész. Archon pl. LibreOffce-ban addig nem is jó a helyesírás-ellenőrzés, amíg mindkettőt fel nem teszi az ember, legalábbis legutóbbról én így emlékszek. A TeXstudio-ra nem emlékszem, de a csomagkezelő azt mondja, hogy annak is függősége a hunspell.

The world runs on Excel spreadsheets. (Dylan Beattie)

Továbbra is tartom, hogy ez TeXstudio bug, és ezen szűkebb értelemben azt értem, hogy hunspell feature. Szerintem hunspellék változtattak az API-n, aminek a hatására régebbi programokban eltört ez a funkció, CLI-ben meg persze, hogy jó, mert az már az új, karbantartott API-val dolgozik. Nem tudom mi most a legújabb a TeXstudio-ból, fel tudsz-e venni PPA-t belőle, vagy megpróbálod Appimage formájában, hogy úgy jó-e. Azért Appimage, mert ahhoz nem kell semmilyen extra szart feltenni, csak letöltöd az Appimage binárist, és futtatod. Flatpakhoz már telepítgetni kell extrákat, de akár az is játszhat. Tesztelés erejéig jó, hátha egy újabb TeXstudio verzióval már nem csinálja.

The world runs on Excel spreadsheets. (Dylan Beattie)

Szerk.: kirprábltam neked, most Archon, hunspell 1.7.0, hunspell hu_HU 1.7-es szótárral, és nekem is ad hülye javaslatokat, pont azokat, amiket neked, de csak a sokadik helyen: őszintén, szintén, őzintőén, őzpintén, őzinúén, őzintés, őzináén, őzingén, őzindén, őzintőn. Ugyanezeket a javaslatokat adja Firefoxban is. Valószínű, ha nem lennék lusta feltenni, és össze akarnám a telepítésével szemetelni a rendszert, akkor a LibreOffice és TeXstudio is ezeket ajánlaná, épp így, épp ebben a sorrendben.

Ezzel én nem foglalkoznék, a hunspell régen is ilyen volt, hogy a sokadik helyen ajánlott hülyeségeket, ezek mindig is irrelevánsak voltak. Az első helyen továbbra is jókat ajánl, felismeri az őzintén-ről, hogy őszintén akart lenni, nem tudom mi akarsz még. Még a második helyen lévő szintén is egy korrekt javaslat szerintem. Tény, hogy ilyen őzintőén, stb. hülyeségeket nem kéne sorolnia, de nem a világ vége.

The world runs on Excel spreadsheets. (Dylan Beattie)

Köszi, hogy megejtetted a kísérletet.

Ha eleve bugos a hunspell (vagy a szóállomány, ami vele jár), miért alkalmazzák néha még m$ alapon futó, írással foglalkozó programok is? (Pl. Scrivener)

Lehetséges, hogy inkább a szótárállomány a hibás, a leszótövezett szavak jegyzéke, egyebek?

10-féle lény van:
-- aki ismeri a bináris számrendszert,
-- és amelyik nem.

Gondolom a fuzzy find algoritmusuk túl laza, vagy túl lazára van konfigolva az érzékenysége és beemel nagyon távoli egyezéseket, vagy távoli alap szavakat enged nem létező végződésekkel, és így jön ki ennyi hülyeség. Tipp, ha ez zavar, a hunspell-HU szótárkészítőit keresd meg, talán ők tudják, hogy miért van így, tervezik-e javítani.

Azért alkalmazza ezt mindenki, mert 1) multiplatformos 2) van múltja, jövője, 3) a magyar kis nyelv, nincs nagy választék, amit ilyen célra tudnál használni, és még akár jobb is lenne. Plusz azért a magyar nyelv ilyen szempontból komplexebb is, mint egy angol, így nehezebb dolguk van tökéletesre gyúrni.

The world runs on Excel spreadsheets. (Dylan Beattie)

Ezt a SymSpellt nem ismerem, nem is hallottam még róla. Nem kétlem egyébként, hogy esetleg jobb lehet, de kérdés melyik szoftver támogatja. Mert a legtöbb hunspell-t támogatja, egy-két kivétel az aspell-t, és kifújt. Egyes szoftvereknek van még saját megoldása, pl. a vim-nek, Emacs-nek van saját spellchecking rendszere, moduljai, szótárai.

The world runs on Excel spreadsheets. (Dylan Beattie)