Koblinger Egmont küldte be a hírt:
Kedves Felhasználóink!
Az UHU-Linux csapata a disztribúció 1.2-es verziójának megjelenése óta most először ismét kiadott egy tesztváltozatot.
A soron következő stabil disztribúcióban több újdonsággal is szeretnénk jelentkezni. Ezekből egyelőre egyet hajtottunk végre, méghozzá az UTF-8 karakterkészletre történő átállást.
Hagyományosan a magyar nyelv ékezetes karaktereinek ábrázolására a Unix típusú rendszerek az ISO-8859-2 (Latin-2) karakterkészletet használták nagyon rég óta. Az utóbbi években hatalmas lendülettel fejlődő szoftverek (elsősorban a többnyelvű grafikus alkalmazások) azonban bebizonyították, hogy a többfajta, egyenként csak néhány nyelv karaktereinek ábrázolására képes 8 bites kódlapok (mint például a Latin-2) használata számtalan megoldhatatlan problémához vezet, így napjainkban lassan minden Linux terjesztés számára elkerülhetetlenné válik az egységes Unicode (UTF-8)
karakterkészletre történő átállás, amely karakterkészlet egymagában képes az összes nyelv összes karakterét ábrázolni, nemcsak körülbelül 200 karaktert.Az átállást némely vezető disztribúció már végrehajtotta, mások még várnak vele pár évet. Az UHU-ban ezt az 1.2 kiadását követő fejlesztői időszakra ütemeztük, jóllehet, az 1.2-ben már komoly előkészületeket tettünk. Most pedig a fejlesztői ágban elvégeztük az átállás legnagyobb részét.
A váltás célja nem más, mint elérni, hogy az ékezetes betűk is minél több helyen gond nélkül használhatók legyenek, az ékezet nélküliekkel azonos módon. A mostani fejlesztői kiadásban ezt az állapotot igen jól megközelítjük, és nyilván a későbbiekben csak javulni fog a helyzet további hibák javításával.
Ismert ékezetkezelési hibák
--------------------------------
Általunk súlyosabbnak ítélt hibák:
- Az ispell és hunspell helyesírás-ellenőrzők terminálban futva nem támogatják az ékezetes betűket. (A hunspell, mint az OpenOffice.org vagy Abiword egy komponense, helyesen működik.)
- Az xqed fordítóprogram ablakának címe hibás, és a csomagban szereplő parancssori programok ("angolul" és "magyarul") nem támogatják az ékezetes betűket.
A hunspell és xqed programok szerzőjével konzultáltunk, a hibák javítása meg fog születni a következő stabil UHU kiadásra.
További hibák:
- A Linux szöveges konzolja (az UHU-Linux alapértelmezett beállításai esetén) ISO-8859-2 karakterkészletet tölt be, így csak az ebben szereplő karaktereket képes helyesen megjeleníteni. Az ezen kívül eső karaktereket a
leginkább hasonlóval közelíti. Egérrel (gpm) másolás során nem az eredeti (megjelenítendő) karakter, hanem a megjelenített változata másolódik, így az adat torzulhat (például hullámos o betűből magyar ő lesz).
- A less fájlnézegető programban nem lehet ékezetes szövegre keresni.
- A Midnight Commander fájlnézegetőjében az ékezetes karakterekre keresés érzékeny a betűméretre.
- Az ISO image tartalmát kilistázó isoinfo program nem támogatja az UTF-8 karakterkészletet Joliet kiterjesztés használata esetén, ennek folyományaként Midnight Commanderben is hibásan jelennek meg az ékezetes
fájlnevek, ha az .iso fájl tartalmát F3-mal kilistáztatjuk vagy Enter-rel böngésszük.
- Többnyire nem támogatják az UTF-8 ékezetes fájlnevet azok a grafikus programok, melyek nem a GTK vagy QT elemkészletre épültek. Néhány példa: ImageMagick, xv, xpdf, ddd, xaos...
- Az enlightenment, blackbox, fluxbox és fvwm ablakkezelőknek gondjai vannak az ékezetes betűkkel.
- Az xterm terminál-emulátor hibásan állítja be az ablak ékezetes címét.
- A jdictionary szótárprogram hibásan jelenít meg bizonyos nem magyar (például francia) ékezeteket.
- Az emacs szövegszerkesztő terminálban futva nem képes ékezetes betűket fogadni a billentyűzetről.
- A joe szövegszerkesztő nem képes némely ékezetes betűket beolvasni a billentyűzetről (a magyar ékezeteket helyesen kezeli).
- Az xscreensaver az idézeteket (fortune-ok) hibás ékezetekkel jeleníti meg.
- A minicom nem támogatja az UTF-8 kódolású terminált, így a magyar fordítást eltávolítottuk belőle, angol nyelvű menü fogadja a felhasználót.
- A talk és ytalk programok nem támogatják az UTF-8 ékezetkódolást.
- Az info program nem támogatja az UTF-8 ékezetkódolást.
- A zsh parancsértelmező nem támogatja a parancssorban az UTF-8 ékezetes betűket.
- A mysql adatbázis-kezelő alapértelmezésben nem UTF-8, hanem ISO-8859-1 karakterkészletet használ. A konfigurációs fájl szerkesztésével könnyedén átállítható UTF-8-ra, azonban nem tudjuk, hogy ez bizonyos szoftverek esetén nem vezetne-e problémákhoz.
- Az 1. CD gyökerében található install.txt fájl ISO-8859-2 kódolásban áll.
Tippek és trükkök
---------------------
- Ha valaki bárhol használta eddig az ő és ű betű Latin-2-es kódját (rendre 245 és 251, nagybetűs párjaiké 213 és 219), akkor ezeket gyorsan el kell felejteni, mivel ezek ezentúl egyértelműen a hullámos o és kalapos u kódjai. A magyar ő és ű betű kódjai ezentúl 337 és 369, nagybetűs párjaiké 336 és
368. Különösen Linux konzolban veszélyes a régi kódok használata, mivel itt a hullámos és kalapos ékezetek képét nem tartalmazza a fontkészlet, így közelítésként magyar ő és ű betűk jelennek meg a képernyőn, miközben az általunk írt fájlba valójában nem magyar ékezetes betűk kerülnek.
- A fájlszerkesztő programok alap értelmezésben UTF-8 kódolást feltételeznek, bár némelyikük (többek közt gedit, kate, kwrite, joe) képes másmilyen kódolású fájlokat is szerkeszteni. Idővel azonban kényelmesebbé teszi életünket, ha fájljainkat UTF-8-ra konvertáljuk.
- Fájljaink tartalma terén az UTF-8 kódolásra átálláshoz használhatjuk az iconv vagy recode parancsokat, néhány példa:
iconv -f Latin2 -t UTF-8 < régifájlneve > újfájlneve
recode latin2..utf8 fájlneve
Ha html fájlt alakítottunk át, a meta fejléc-sorban a karakterkészletet (amennyiben volt ilyen) át kell írnunk UTF-8-ra. TeX fájl átalakítása esetén az inputenc csomag paraméterét latin2-ről utf8-ra kell átírni, és telepíteni
a tetex-unicode csomagot.
- Fájlneveink konvertálására használjuk a convmv parancsot, például egy könyvtár rekurzív bejárásához:
convmv -r -f Latin2 -t UTF-8 könyvtárneve
A tényleges működéshez szükségünk lesz a --notest kapcsolóra is.
- Ha ideiglenesen Latin-2 karakterkészletű terminálra van szükségünk (például távoli, Latin-2-t használó gépre ssh-val belépéshez), használjuk a
LANG=hu_HU luit
parancsot, vagy a screen programban üssünk Ctrl+A-t, majd egy kettőspontot, végül adjuk ki az "encoding iso-8859-2" parancsot (idézőjelek nélkül). Esetleg próbálkozhatunk a ttyconv programmal is.
Szokásos figyelmeztetés
----------------------------
Mint ilyenkor szokásos, most is felhívnánk a figyelmet, hogy fejlesztői teszt változatról van szó, amely ugyan tapasztalataink alapján legalább annyira használható, mint a stabil 1.2-es, ennek ellenére ehhez a disztribúcióhoz nem nyújtunk semmiféle támogatást, nem adunk ki biztonsági
javításokat, és újabb teszt verzió megjelenése után valószínűleg töröljük szervereinkről. Mivel a fejlesztői ág folyamatosan változik, nem garantáljuk azt sem, hogy később a dev ágból külön letöltött csomagok telepíthetők volnának.
Ennek megfelelően tisztelettel kérnénk, hogy a használatával kapcsolatos, és a hivatalos 1.2-es verzióra nem vonatkozó kérdésekkel _ne_ írjon senki a kezdő levelezési listára. Az UTF-8-cal kapcsolatos felhasználói kérdéseket (a stabil disztribúció megjelenéséig) kizárólag a haladó listánkra várjuk,
míg a fejlesztést elősegítő észrevételeket, ékezetkezelési hibák bejelentését a dev levelezési listán olvassuk. A listákra feliratkozni, archívumot megtekinteni a lists.uhulinux.hu címen lehet.
Felhívnánk továbbá a figyelmet, hogy jelen kiadás (egy-két kivételtől, valamint az UTF-8-ra átállástól eltekintve) az 1.2-vel azonos csomagokat szállít, így senki ne számítson újabb verziójú programokra, jobb hardverkezelésre, nagyobb teljesítményre, megnövekedett stabilitásra és semmi ehhez hasonlóra, mert azzal ebben a kiadásban nem fog találkozni.
A csomagkészítőkhöz még egy külön kérésünk volna. Az átállás során az uhubuild rendszert is érintették apró változások, amelyek a készülő csomagra is kihatással vannak. Éppen ezért nagyon fontos odafigyelni, hogy UHU 1.2-höz készülő csomagok esetén a chroot környezet ne az UTF-8-as tesztverzió, hanem az igazi UHU 1.2 csomagjaiból épüljön fel. Arra is figyelni kell, hogy a csomagleírások, és esetleges egyéb plusz fájlok (konfigurációs fájl, init szkript stb.) Latin-2 kódolást használjanak.
A teszt verzió a ftp://ftp.uhulinux.hu/uhu/dev/snapshots-1.2-UTF8/ címről tölthető le.
--
Üdvözlettel:
UHU-Linux Csapat