UHU-Linux UTF-8 tesztkiadás

 ( trey | 2005. szeptember 14., szerda - 12:53 )

Koblinger Egmont küldte be a hírt:

Kedves Felhasználóink!

Az UHU-Linux csapata a disztribúció 1.2-es verziójának megjelenése óta most először ismét kiadott egy tesztváltozatot.

A soron következő stabil disztribúcióban több újdonsággal is szeretnénk jelentkezni. Ezekből egyelőre egyet hajtottunk végre, méghozzá az UTF-8 karakterkészletre történő átállást.

Hagyományosan a magyar nyelv ékezetes karaktereinek ábrázolására a Unix típusú rendszerek az ISO-8859-2 (Latin-2) karakterkészletet használták nagyon rég óta. Az utóbbi években hatalmas lendülettel fejlődő szoftverek (elsősorban a többnyelvű grafikus alkalmazások) azonban bebizonyították, hogy a többfajta, egyenként csak néhány nyelv karaktereinek ábrázolására képes 8 bites kódlapok (mint például a Latin-2) használata számtalan megoldhatatlan problémához vezet, így napjainkban lassan minden Linux terjesztés számára elkerülhetetlenné válik az egységes Unicode (UTF-8)
karakterkészletre történő átállás, amely karakterkészlet egymagában képes az összes nyelv összes karakterét ábrázolni, nemcsak körülbelül 200 karaktert.Az átállást némely vezető disztribúció már végrehajtotta, mások még várnak vele pár évet. Az UHU-ban ezt az 1.2 kiadását követő fejlesztői időszakra ütemeztük, jóllehet, az 1.2-ben már komoly előkészületeket tettünk. Most pedig a fejlesztői ágban elvégeztük az átállás legnagyobb részét.

A váltás célja nem más, mint elérni, hogy az ékezetes betűk is minél több helyen gond nélkül használhatók legyenek, az ékezet nélküliekkel azonos módon. A mostani fejlesztői kiadásban ezt az állapotot igen jól megközelítjük, és nyilván a későbbiekben csak javulni fog a helyzet további hibák javításával.

Ismert ékezetkezelési hibák
--------------------------------

Általunk súlyosabbnak ítélt hibák:

- Az ispell és hunspell helyesírás-ellenőrzők terminálban futva nem támogatják az ékezetes betűket. (A hunspell, mint az OpenOffice.org vagy Abiword egy komponense, helyesen működik.)

- Az xqed fordítóprogram ablakának címe hibás, és a csomagban szereplő parancssori programok ("angolul" és "magyarul") nem támogatják az ékezetes betűket.

A hunspell és xqed programok szerzőjével konzultáltunk, a hibák javítása meg fog születni a következő stabil UHU kiadásra.

További hibák:

- A Linux szöveges konzolja (az UHU-Linux alapértelmezett beállításai esetén) ISO-8859-2 karakterkészletet tölt be, így csak az ebben szereplő karaktereket képes helyesen megjeleníteni. Az ezen kívül eső karaktereket a
leginkább hasonlóval közelíti. Egérrel (gpm) másolás során nem az eredeti (megjelenítendő) karakter, hanem a megjelenített változata másolódik, így az adat torzulhat (például hullámos o betűből magyar ő lesz).

- A less fájlnézegető programban nem lehet ékezetes szövegre keresni.

- A Midnight Commander fájlnézegetőjében az ékezetes karakterekre keresés érzékeny a betűméretre.

- Az ISO image tartalmát kilistázó isoinfo program nem támogatja az UTF-8 karakterkészletet Joliet kiterjesztés használata esetén, ennek folyományaként Midnight Commanderben is hibásan jelennek meg az ékezetes
fájlnevek, ha az .iso fájl tartalmát F3-mal kilistáztatjuk vagy Enter-rel böngésszük.

- Többnyire nem támogatják az UTF-8 ékezetes fájlnevet azok a grafikus programok, melyek nem a GTK vagy QT elemkészletre épültek. Néhány példa: ImageMagick, xv, xpdf, ddd, xaos...

- Az enlightenment, blackbox, fluxbox és fvwm ablakkezelőknek gondjai vannak az ékezetes betűkkel.

- Az xterm terminál-emulátor hibásan állítja be az ablak ékezetes címét.

- A jdictionary szótárprogram hibásan jelenít meg bizonyos nem magyar (például francia) ékezeteket.

- Az emacs szövegszerkesztő terminálban futva nem képes ékezetes betűket fogadni a billentyűzetről.

- A joe szövegszerkesztő nem képes némely ékezetes betűket beolvasni a billentyűzetről (a magyar ékezeteket helyesen kezeli).

- Az xscreensaver az idézeteket (fortune-ok) hibás ékezetekkel jeleníti meg.

- A minicom nem támogatja az UTF-8 kódolású terminált, így a magyar fordítást eltávolítottuk belőle, angol nyelvű menü fogadja a felhasználót.

- A talk és ytalk programok nem támogatják az UTF-8 ékezetkódolást.

- Az info program nem támogatja az UTF-8 ékezetkódolást.

- A zsh parancsértelmező nem támogatja a parancssorban az UTF-8 ékezetes betűket.

- A mysql adatbázis-kezelő alapértelmezésben nem UTF-8, hanem ISO-8859-1 karakterkészletet használ. A konfigurációs fájl szerkesztésével könnyedén átállítható UTF-8-ra, azonban nem tudjuk, hogy ez bizonyos szoftverek esetén nem vezetne-e problémákhoz.

- Az 1. CD gyökerében található install.txt fájl ISO-8859-2 kódolásban áll.

Tippek és trükkök
---------------------

- Ha valaki bárhol használta eddig az ő és ű betű Latin-2-es kódját (rendre 245 és 251, nagybetűs párjaiké 213 és 219), akkor ezeket gyorsan el kell felejteni, mivel ezek ezentúl egyértelműen a hullámos o és kalapos u kódjai. A magyar ő és ű betű kódjai ezentúl 337 és 369, nagybetűs párjaiké 336 és
368. Különösen Linux konzolban veszélyes a régi kódok használata, mivel itt a hullámos és kalapos ékezetek képét nem tartalmazza a fontkészlet, így közelítésként magyar ő és ű betűk jelennek meg a képernyőn, miközben az általunk írt fájlba valójában nem magyar ékezetes betűk kerülnek.

- A fájlszerkesztő programok alap értelmezésben UTF-8 kódolást feltételeznek, bár némelyikük (többek közt gedit, kate, kwrite, joe) képes másmilyen kódolású fájlokat is szerkeszteni. Idővel azonban kényelmesebbé teszi életünket, ha fájljainkat UTF-8-ra konvertáljuk.

- Fájljaink tartalma terén az UTF-8 kódolásra átálláshoz használhatjuk az iconv vagy recode parancsokat, néhány példa:

iconv -f Latin2 -t UTF-8 < régifájlneve > újfájlneve

recode latin2..utf8 fájlneve

Ha html fájlt alakítottunk át, a meta fejléc-sorban a karakterkészletet (amennyiben volt ilyen) át kell írnunk UTF-8-ra. TeX fájl átalakítása esetén az inputenc csomag paraméterét latin2-ről utf8-ra kell átírni, és telepíteni
a tetex-unicode csomagot.

- Fájlneveink konvertálására használjuk a convmv parancsot, például egy könyvtár rekurzív bejárásához:

convmv -r -f Latin2 -t UTF-8 könyvtárneve

A tényleges működéshez szükségünk lesz a --notest kapcsolóra is.

- Ha ideiglenesen Latin-2 karakterkészletű terminálra van szükségünk (például távoli, Latin-2-t használó gépre ssh-val belépéshez), használjuk a

LANG=hu_HU luit

parancsot, vagy a screen programban üssünk Ctrl+A-t, majd egy kettőspontot, végül adjuk ki az "encoding iso-8859-2" parancsot (idézőjelek nélkül). Esetleg próbálkozhatunk a ttyconv programmal is.

Szokásos figyelmeztetés
----------------------------

Mint ilyenkor szokásos, most is felhívnánk a figyelmet, hogy fejlesztői teszt változatról van szó, amely ugyan tapasztalataink alapján legalább annyira használható, mint a stabil 1.2-es, ennek ellenére ehhez a disztribúcióhoz nem nyújtunk semmiféle támogatást, nem adunk ki biztonsági
javításokat, és újabb teszt verzió megjelenése után valószínűleg töröljük szervereinkről. Mivel a fejlesztői ág folyamatosan változik, nem garantáljuk azt sem, hogy később a dev ágból külön letöltött csomagok telepíthetők volnának.

Ennek megfelelően tisztelettel kérnénk, hogy a használatával kapcsolatos, és a hivatalos 1.2-es verzióra nem vonatkozó kérdésekkel _ne_ írjon senki a kezdő levelezési listára. Az UTF-8-cal kapcsolatos felhasználói kérdéseket (a stabil disztribúció megjelenéséig) kizárólag a haladó listánkra várjuk,
míg a fejlesztést elősegítő észrevételeket, ékezetkezelési hibák bejelentését a dev levelezési listán olvassuk. A listákra feliratkozni, archívumot megtekinteni a lists.uhulinux.hu címen lehet.

Felhívnánk továbbá a figyelmet, hogy jelen kiadás (egy-két kivételtől, valamint az UTF-8-ra átállástól eltekintve) az 1.2-vel azonos csomagokat szállít, így senki ne számítson újabb verziójú programokra, jobb hardverkezelésre, nagyobb teljesítményre, megnövekedett stabilitásra és semmi ehhez hasonlóra, mert azzal ebben a kiadásban nem fog találkozni.

A csomagkészítőkhöz még egy külön kérésünk volna. Az átállás során az uhubuild rendszert is érintették apró változások, amelyek a készülő csomagra is kihatással vannak. Éppen ezért nagyon fontos odafigyelni, hogy UHU 1.2-höz készülő csomagok esetén a chroot környezet ne az UTF-8-as tesztverzió, hanem az igazi UHU 1.2 csomagjaiból épüljön fel. Arra is figyelni kell, hogy a csomagleírások, és esetleges egyéb plusz fájlok (konfigurációs fájl, init szkript stb.) Latin-2 kódolást használjanak.

A teszt verzió a ftp://ftp.uhulinux.hu/uhu/dev/snapshots-1.2-UTF8/ címről tölthető le.

--
Üdvözlettel:
UHU-Linux Csapat

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Jol mondja kollega ur! Azok az atkozott ekezetek keseritik meg az egyszeri arvizturofurogepet vasarlo luzer eletet ;)

Miért kivéve a japánokat? Tudtommal a japán írást is éppúgy támogatja az UTF-8, csak a japánok még sokkal jobban ragaszkodnak a régi saját EUC-JP kódolásukhoz és még kevésbé akarják elfogadni hogy idővel váltani kell. A sztori persze a lényegét tekintve ugyanaz mint nálunk.

Vagy volna valami, amiben az UTF-8 tényleg rosszabb számukra?

A japánoknak, kínaiaknak és koreaiaknak azért szívás az UTF-8, mert a jó
kis két bájtos karaktereik helyett 3 és 4 bájtos minden UTF-8 szekvecia.
Duplára nő minden fájl mérete.

Nem az köcsög, aki nem ért egyet, hanem az, aki nyilvánvalóan úgy hangoztatja saját véleményét, hogy közben meg sem próbálja megérteni a másik fél másmilyen igényeit, másmilyen szempontjait, másmilyen érveit stb... szóval aki nulla nyitottsággal a végsőkig kiáll az általa megszokott rendszer tökéletessége mellett. Vagy csak azért beszól, mert az neki jól esik, vagy mert menő dolog az UHU-t szapulni, tök mindegy hogy mit csinálnak.

Egyébként ha valakinek még mindig nem volna világos netalántán: amikor arról van szó, hogy UTF-8-ra átállunk, akkor a tartalmat, valamint a tartalom megjelenítéséért felelős kódokat _egyaránt_ átállítjuk, pontosan azért, hogy minden ékezet (ne csak a magyarok) helyesen látszódjanak, vagyis míg a hivatalos UHU 1.2-ben sajnos még többször találkozni olyasmi krixkraxokkal, mint amiket Aewyn poénból írt, addig a mostani tesztkiadásban már (lényegében) sehol sem, a betűk mindenütt pontosan úgy jelennek meg, pontosan olyan ékezettel (és még picit sem másmilyennel), ahogyan meg kell jelenniük. Erről van szó. Ki lehet próbálni, és aki kipróbálta, nem csak látatlanban él feltételezésekkel, attól szívesen vesszük az észrevételeket (jókat, rosszakat egyaránt) a továbbiakban is.

Félreértés ne essék, nem Aewyn ellen akarnék szólni, az ő írását poénnak tekintem mert szerintem pusztán annak szánta, csak tökéletes alkalom adódott, hogy még egyszer, remélhetőleg utoljára összefoglaljam, hogy miről is van szó.

Aha, értem. Mondjuk figyelembe véve a technikai fejlődés mértékét, valahogy ezt a szempontot nem tudom komolyan venni. Nyilván csak a szövegfájlok mérete nő szűk duplájára (azért a cjk karakterek túlnyomó többsége csak 3 byte az UTF-8-ban, tehát a másfeles szorzó tűnik reálisnak), a képek, videók, programok stb. mérete változatlan marad. Tehát nagy átlagban lehet mondjuk úgy 1.05 alatti méret-szorzóra számítani szerintem. Na jó, talán spéci szöveges gigantikus méretű adatbázisok esetén 1.5 körülire. Namost ha megnézzük, hogy mennyi időnként nő az átlag sávszélesség, az átlag tárolókapacitás, átlag prociteljesítmény (a szövegek feldolgozására) stb. újra meg újra az ennyiszeresére, akkor jót fogunk röhögni, figyelembe véve hogy a karakterkészlet kapcsán egyszeri, nem ismétlődő átállásról van szó. Magyarán szólva: szerintem elhanyagolható a méretnövekedés, nem érdemes vele foglalkozni, ha cserébe a többnyelvűség korrekt támogatása és bármiféle szoftver nemzetközi piacon jobban eladhatósága áll a mérleg túloldalán.

Nade legalább már tudom, hogy miért duzzognak. :-)

nem utf16? nekem úgy dereng.

Jaja... egyetértek.. A kérdés: a japánokkal mi a baj?
Úgy látom hogy hiragana-t és katakana-t lehet írni... talán a kanji nem megy?

Egyébként meg itt egy szemléletes példa, hogy miért is jó az utf8:

http://www.columbia.edu/kermit/utf8.html

Bocsánat, demagóg voltam :(

Mindenesetre jó az utf-8, legalább lehet dobálni az adatokat különböző nyelvű rendszerek között, és mindenhol stimmelni fog. De ezt leírták mások is, én csak megkövetem magam...

Ezen az oldalon kanji-k is vannak.

latin2-ben nincs francia kalapos u betű. Persze jó a latin2 inputenc, ha jó neked hogy ezt a betűt escape-elve rakod a tex fájlba, ami kódolás semmilyen más rendszerrel nem kompatibilis, a fájl szerkesztése során sem ezt látod, nem tudod copy-paste-elni html, sima txt, vagy ilyesmi formátumok között. De ha valaki az egyszerűbb utat akarja járni és kalapos u-t látni mindenütt, a tex fájl szerkesztése közben is, és vele párhuzamosan magyar ű-t is használni, akkor neki a ma létező karakterkészletek közül csak valami unicode alapú (leginkább az utf8) lesz jó.

A java változó nevek bármilyen unicode karaktert tartalmazhatnak. Maga a forrás file többnyire a platform encodingjában van tárolva, de ez nem kötelező. A forditónak meg lehet adni a kezdetek óta, hogy milyen encodingot használva próbálja meg értelmezni a dolgokat. Természetesen, ha ISO-8859-1-ben mentjük el a forrás fájlt, akkor nehezen fogunk tudni mondjuk egy kinai karaktert tartalmazó változóra hivatkozni :)
Maga a leforditott class fileba viszont minden string UTF8-ként kerül tárolásra.

egmont még a végén szívinfarktust kapsz és UTF8-as sírköved lesz :)

Az UHU halajdon előre a kijelölt úton a többiek is úgyis erre fognak lépni. A tisztán amerikai meg mini disztrók úgyis maradnak a régi hagyományosnál egy darabig.

> Sajnos (UHU-s) fanatikusokkal elég nehéz értelmesen
> beszélni.. hugyagyuak.

Kene slrn-be egy olyan feature h be tudjam jelolni hogy ki az
aki a hulyesegevel mar regebben elasta magat nalam.

Ez az egész UTF8 megérne egy misét.. kicsit túl van lihegve.:)
Nem tudom ki hogy van vele, de szerintem a többség, aki konzolon is használja a rendszert, általában ki szokta kapcsolni az utf8 kodolást (ha azzal települ a rendszer) és átállítja ISO-8859-X-re.
Jó nagyokat lehet szivni az UTF8-as confog fájlokkal.
A kevés kivételtől eltekintve véleményem szerint a baromság netovábbja a "midnenhol UTF8" elképzelés..
Fri

unset LANG

A legidegesitobb, amikor a vim on-the-fly konvertalja a fajlt utf-8 -ba (ami eredetileg sima szoveges fajl volt), igy mysql .sql fajljait remalom nezni.
Raadasul szerkeszteni is. Mivel a kepernyon ilyen 2 ekezetes betu van egymas mellett, mintha utf-8 lenne.

Nem is ertem miert nem lehet ugy csinalni, hogy egy fajlban ha utf8 karakterek kozott sima latin2 karakter van, akkor annak a hatterszine mondjuk piros, de attol meg jol jelenne meg.

jó. akkor dögöljön meg minden magyar, cseh, lengyel, maláj, kínai, japán, stb., aki nem a korlátozott angol karakterkészletet akarja használni?

értem, hogy mit mondasz, de az hosszú távon nem a legjárhatóbb út. szvsz

Az alábbi címen:

http://www.cs.bme.hu/~egmont/utf8/ [www.cs.bme.hu]

találsz egy leírást, a 0., 1. és 2. fejezet az érdekes csak belőle, ahol igencsak részletesen kifejtem, hogy miért van szükség mindenütt az UTF-8 használatára, és mik a teljességgel megoldható problémák az ISO-8859-X karakterkészletekkel.

Örülnék, ha te is konkrétumokat írnál, vagy általam írt konkrétumokat cáfolnál meg általános életérzés helyett.

Egyébként érzésedet az is alátámaszthatja, hogy technikailag még akad tennivaló az UTF-8 helyes támogatása terén, nekünk is több alapvető utilityt és még a kernelt is meg kellett patchelnünk, és emiatt nem igazán látom, hogy tudná egy disztrib egyszerre támogatni a 8859-eket és az UTF-8-at is. Éppen ezért mi váltottunk, mostantól csak UTF-8.

Szóval két külön kérdés, hogy elvileg az UTF-8 mennyire jó, és hogy gyakorlatilag amit egyik-másik disztrib nyújt UTF-8 címszó alatt, az mennyire használható.

Ha van időd, próbáld ki az új UHU-t, és meglátod, ha mit sem tudsz arról hogy mi az a 8859-2 és UTF-8, egyszerűen csak használni kezded a rendszert és irogatsz ékezetes betűket, szinte semmi különbséget nem fogsz észrevenni, például a szöveges Linux konzolon látszólag teljesen ugyanúgy működnek továbbra is a magyar ékezetek, mint eddig (noha a háttérben teljesen más történik, de látszólag ugyanaz: leütsz egy ékezetes betűt, az megjelenik, pont mint egy ékezet nélküli).

hülye vagyok, na
szóval:
... mik a teljességgel _megoldhatatlan_ problémák az ISO-8859-X karakterkészletekkel ...

Ha egy fájlban kétféle kódolás váltakozik (utf8 és latin2), akkor már régesrég rossz valami abban a rendszerben, amit használni akarsz. Egyébként feature-javaslatoddal ajánlom, keresd meg a vim fejlesztőjét!

Azt értem, hogy meg kellet heggeszteni a kernelt meg egy csomó mindent. Azt meglehet oldani esetleg duál Bootal, hogy UTF-( vagy elavult karakterkészletet válaszon az ember?
Nekem pillanatnyilag úgy van megoldva Wine segitségével Windowsos Akrobatreader fent figyel és ami elavult azt azzal nyitom meg.
Nem tul elegáns viszont müködő megoldás.

Semmi nem akadályoz meg benne, hogy két külön partícióra telepíts egy 1.2-t és egy 1.2-UTF8-at, amik semmit sem tudnak egymásról. Értelmét viszont nem látom.

Ha csak egy-egy ősrégi elkefélt alkalmazás kedvéért kell Latin2-es környezet, az megoldható simán az új UHU alatt is, sőt, van is pár program, amelyik automatikusan ilyen wrapperen keresztül indul, mivel az új LANG=hu_HU.UTF-8 környezeti változóval nem működik helyesen, tehát itt elrejtjük azt, hogy valójában ez a néhány program Latin2-es lelkivilágú.

Hasonlóan Latin2 kódolást használó fájlok szerkesztésére is több progi is képes.

Szóval egy-egy pillanatra Latin2-be visszakapcsolni egy-egy progi futtatása vagy fájl szerkesztése erejéig nem probléma az új UHU-val. Ugyanakkor a komplett disztribet nem tudod Latin2-re visszakapcsolni (illetve tudod csak csomó minden rossz lesz), hiszen a konfig fájlok kommentjeit, manpage-eket, csomagjaink leírását és rakat ilyesmi dolgot alakítottunk át UTF8-ra, amit ha Latin2 környezetben akarsz megjeleníteni, akkor jön az ékezetes betű helyett két karakternyi olvashatatlan borzalom, aminek pont az elkerülése a cél.

Szia Egmont!

Én ugyan csak olvasója vagyok a hup.hu-nak és szinte sohasem szólok hozzá a témákhoz, hiszen engem csak a hírek és az emberek véleménye érdekel. Most viszont úhy érzem, hogy szólnom kell.

1. gratulálok az UTF8-as kódolás bevezetéséhez, de hibáztok. Magam is hosszú-hosszú ideje vagyok rendszergazda és az UTF8-nak NEM JÖTT EL AZ IDEJE!

2. Hivatkozol a SuSE disztibre, hogy ők már átálltak. Szinte az összes, általam adminolt szerver különféle SuSE disztibeket futtat 7.3-9.3 bezárólag. A SuSE megoldotta, hogy vissza tudjak állni UTF8-ról és ha visszaállok úgy is MŰKÖDIK! Gondolom ez a tény elkerülte a figyelmedet.

3. a hangvételed nem igazán kelti egy határozott SZAKEMBER benyomását. Úgy beszélsz az emberekkel, mint a kutyákkal, folyik a szádból a trágyalé, akkora paraszt vagy.

4. Ebből ered, hogy az életben nem fogom használni az UHU-t! Hogyan kaphatok normális supportot, ha csak egy fórumban így beszél a cég képviselője velem/az emberekkel? ( a SuSE ebben nagyon ott van.... ).

5. Volt annak idején egy projektunk, amiből azért DOBTUK KI AZ UHU-t, mert olyan nagyképű supportot kaptunk, olyan szakmai felkészületlenséget tapasztaltunk, ami számunkra nem volt megengedhető, viszont a SuSE képes volt segíteni. ( Funny, nem? )

6. Én eddig támogattam a magyar szoftvereket, de az UHU most az első olyan, akit én BOZTOSAN nem fogok támogatni és ajánlani sem.

Szerintem, öreg, szállj le a magas lóról és töröld meg a nózikádat és próbáld meg a SZAKMÁBAN dolgozó emberek véleményét elfogadni; amivel nem kell egyet is értened. Sajnos az olyan bunkók, mint te rontják el e szakma hírét, magad rontod el a saját és a disztibed imázsát. Szerintem.

Borzasztóan sajnálom, hogy pont egy viszonylag jó, magyar terméket tesztek tönkre a beképzeltségetekkel és nagyképűségetekkel. Eddig bármilyen külföldi szoftverkészítő cégnek írtam support ügyben, ha nem is tudott segíteni DE udvarias volt. Szedd össze magad ember....

Üdv,

Johnny

Beleolvatam a doksidba, de engem nem gyözött meg..
Pontosabban arról, hogy két malomban örölünk..
Az "ézéssel" kicsit melléfogtál", ugyanis nem érzés, hanem programozási, rendszergazdai tapasztalat.. és rosszak, ezért nem igazán tudsz meggyőzni.

Konkrétumok:
- szerkessz egy shell scriptet UTF8-ban (szép magyar magyarázatokkal, kiirásokkal) és add oda valakinek.. ha ISO-s a rendszere, csuklani fogsz, de rendesen.
- a konzolok, parancsok nyelve "angol" orientált..
- nagyon kevés olyan ember van, aki szüksége van arra, hogy konzolban a beszélt nyelvén kivül kinaiúl, csehül vagy egyéb nyelven is irjon egy "doksiban".
Arra ott vannak a GUI-s szerkesztök. Ha meg valaki akar, hát olyan editor-t választ ami tud UTF-at.

.. és folytathatnám.

Mielőtt az észt osztod, hogy mit probáljak ki.. probáldj ki Te egy UTF-es rendszert, amiről 5-10 másik rendszert felügyelsz, amik nem UTF8-asok.
Én egyszer "kiprobáltam".. rémállom.
Mielőtt.. tisztában vagyok vele, hogy á tlehet álligatni a konzolt, hogy ne legyen probléma..
Fri

Szia Egmont!

Én ugyan csak olvasója vagyok a hup.hu-nak és szinte sohasem szólok hozzá a témákhoz, hiszen engem csak a hírek és az emberek véleménye érdekel. Most viszont úhy érzem, hogy szólnom kell.

1. gratulálok az UTF8-as kódolás bevezetéséhez, de hibáztok. Magam is hosszú-hosszú ideje vagyok rendszergazda és az UTF8-nak NEM JÖTT EL AZ IDEJE!

2. Hivatkozol a SuSE disztibre, hogy ők már átálltak. Szinte az összes, általam adminolt szerver különféle SuSE disztibeket futtat 7.3-9.3 bezárólag. A SuSE megoldotta, hogy vissza tudjak állni UTF8-ról és ha visszaállok úgy is MŰKÖDIK! Gondolom ez a tény elkerülte a figyelmedet.

3. a hangvételed nem igazán kelti egy határozott SZAKEMBER benyomását. Úgy beszélsz az emberekkel, mint a kutyákkal, folyik a szádból a trágyalé, akkora paraszt vagy.

4. Ebből ered, hogy az életben nem fogom használni az UHU-t! Hogyan kaphatok normális supportot, ha csak egy fórumban így beszél a cég képviselője velem/az emberekkel? ( a SuSE ebben nagyon ott van.... ).

5. Volt annak idején egy projektunk, amiből azért DOBTUK KI AZ UHU-t, mert olyan nagyképű supportot kaptunk, olyan szakmai felkészületlenséget tapasztaltunk, ami számunkra nem volt megengedhető, viszont a SuSE képes volt segíteni. ( Funny, nem? )

6. Én eddig támogattam a magyar szoftvereket, de az UHU most az első olyan, akit én BOZTOSAN nem fogok támogatni és ajánlani sem.

Szerintem, öreg, szállj le a magas lóról és töröld meg a nózikádat és próbáld meg a SZAKMÁBAN dolgozó emberek véleményét elfogadni; amivel nem kell egyet is értened. Sajnos az olyan bunkók, mint te rontják el e szakma hírét, magad rontod el a saját és a disztibed imázsát. Szerintem.

Borzasztóan sajnálom, hogy pont egy viszonylag jó, magyar terméket tesztek tönkre a beképzeltségetekkel és nagyképűségetekkel. Eddig bármilyen külföldi szoftverkészítő cégnek írtam support ügyben, ha nem is tudott segíteni DE udvarias volt. Szedd össze magad ember....

Üdv,

Johnny

Az unicodera valo atallas kerdeseben alapvetoen egyetertunk, de azert ez egy kicsit olyan, hogy holnaptol atterunk a balos kozlekedesre, de eloszor csak a kamionok (itt nem az egyik verziotok kodnevere utaltam :-))...

Szoval a fenntartasaim:

1. Vannak egyszeru atallasi lepesek, amik sima beallitasnak tekinthetok, es vannak problemasak:
a) fileok tartalmat konvertalni kell
b) filerendszert konvertalni kell
c) lehetnek olyan applikaciok, amik tovabbra sem kezelik rendesen a unicode karaktereket

2. Kompatibilitasi problemak lehetnek levelezesben, ill. egyeb kommunikacioban, ahol a megosztott infomraciot kezelo applikacio nincs rendesen felkeszitve tobbfele karakterkodolas kezelesere.

En mar sokszor fontolgattam az atallast, de aztan a fenti problemak okan meg a mai napig nem tettem meg.

Szia Egmont!

Én ugyan csak olvasója vagyok a hup.hu-nak és szinte sohasem szólok hozzá a témákhoz, hiszen engem csak a hírek és az emberek véleménye érdekel. Most viszont úhy érzem, hogy szólnom kell.

1. gratulálok az UTF8-as kódolás bevezetéséhez, de hibáztok. Magam is hosszú-hosszú ideje vagyok rendszergazda és az UTF8-nak NEM JÖTT EL AZ IDEJE!

2. Hivatkozol a SuSE disztibre, hogy ők már átálltak. Szinte az összes, általam adminolt szerver különféle SuSE disztibeket futtat 7.3-9.3 bezárólag. A SuSE megoldotta, hogy vissza tudjak állni UTF8-ról és ha visszaállok úgy is MŰKÖDIK! Gondolom ez a tény elkerülte a figyelmedet.

3. a hangvételed nem igazán kelti egy határozott SZAKEMBER benyomását. Úgy beszélsz az emberekkel, mint a kutyákkal, folyik a szádból a trágyalé, akkora paraszt vagy.

4. Ebből ered, hogy az életben nem fogom használni az UHU-t! Hogyan kaphatok normális supportot, ha csak egy fórumban így beszél a cég képviselője velem/az emberekkel? ( a SuSE ebben nagyon ott van.... ).

5. Volt annak idején egy projektunk, amiből azért DOBTUK KI AZ UHU-t, mert olyan nagyképű supportot kaptunk, olyan szakmai felkészületlenséget tapasztaltunk, ami számunkra nem volt megengedhető, viszont a SuSE képes volt segíteni. ( Funny, nem? )

6. Én eddig támogattam a magyar szoftvereket, de az UHU most az első olyan, akit én BOZTOSAN nem fogok támogatni és ajánlani sem.

Szerintem, öreg, szállj le a magas lóról és töröld meg a nózikádat és próbáld meg a SZAKMÁBAN dolgozó emberek véleményét elfogadni; amivel nem kell egyet is értened. Sajnos az olyan bunkók, mint te rontják el e szakma hírét, magad rontod el a saját és a disztibed imázsát. Szerintem.

Borzasztóan sajnálom, hogy pont egy viszonylag jó, magyar terméket tesztek tönkre a beképzeltségetekkel és nagyképűségetekkel. Eddig bármilyen külföldi szoftverkészítő cégnek írtam support ügyben, ha nem is tudott segíteni DE udvarias volt. Szedd össze magad ember....

Üdv,

Johnny

Nem.. én azt mondom, hogy van amiben ésszerű az átállás, van amiben meg nem ésszerű. GUI-s felületen: kell és jó is, konzolon már erősen kétségbe vonható.

Szia Egmont!

Én ugyan csak olvasója vagyok a hup.hu-nak és szinte sohasem szólok hozzá a témákhoz, hiszen engem csak a hírek és az emberek véleménye érdekel. Most viszont úhy érzem, hogy szólnom kell.

1. gratulálok az UTF8-as kódolás bevezetéséhez, de hibáztok. Magam is hosszú-hosszú ideje vagyok rendszergazda és az UTF8-nak NEM JÖTT EL AZ IDEJE!

2. Hivatkozol a SuSE disztibre, hogy ők már átálltak. Szinte az összes, általam adminolt szerver különféle SuSE disztibeket futtat 7.3-9.3 bezárólag. A SuSE megoldotta, hogy vissza tudjak állni UTF8-ról és ha visszaállok úgy is MŰKÖDIK! Gondolom ez a tény elkerülte a figyelmedet.

3. a hangvételed nem igazán kelti egy határozott SZAKEMBER benyomását. Úgy beszélsz az emberekkel, mint a kutyákkal, folyik a szádból a trágyalé, akkora paraszt vagy.

4. Ebből ered, hogy az életben nem fogom használni az UHU-t! Hogyan kaphatok normális supportot, ha csak egy fórumban így beszél a cég képviselője velem/az emberekkel? ( a SuSE ebben nagyon ott van.... ).

5. Volt annak idején egy projektunk, amiből azért DOBTUK KI AZ UHU-t, mert olyan nagyképű supportot kaptunk, olyan szakmai felkészületlenséget tapasztaltunk, ami számunkra nem volt megengedhető, viszont a SuSE képes volt segíteni. ( Funny, nem? )

6. Én eddig támogattam a magyar szoftvereket, de az UHU most az első olyan, akit én BOZTOSAN nem fogok támogatni és ajánlani sem.

Szerintem, öreg, szállj le a magas lóról és töröld meg a nózikádat és próbáld meg a SZAKMÁBAN dolgozó emberek véleményét elfogadni; amivel nem kell egyet is értened. Sajnos az olyan bunkók, mint te rontják el e szakma hírét, magad rontod el a saját és a disztibed imázsát. Szerintem.

Borzasztóan sajnálom, hogy pont egy viszonylag jó, magyar terméket tesztek tönkre a beképzeltségetekkel és nagyképűségetekkel. Eddig bármilyen külföldi szoftverkészítő cégnek írtam support ügyben, ha nem is tudott segíteni DE udvarias volt. Szedd össze magad ember....

Üdv,

Johnny

Nem gondolod, hogy a létező legnagyobb kavalkádhoz vezet, ha a rendszer különböző komponensei egymással nem kompatibilis karakterkódolást használnak? Megírsz egy fájlt grafikus módban, nem látod jól az ékezeteket szövegesen. Egy másikat szöveges módban írsz meg, annak az ékezetei grafikusan nem lesznek jók. Tényleg ez kell neked?

Szia Egmont!

Én ugyan csak olvasója vagyok a hup.hu-nak és szinte sohasem szólok hozzá a témákhoz, hiszen engem csak a hírek és az emberek véleménye érdekel. Most viszont úhy érzem, hogy szólnom kell.

1. gratulálok az UTF8-as kódolás bevezetéséhez, de hibáztok. Magam is hosszú-hosszú ideje vagyok rendszergazda és az UTF8-nak NEM JÖTT EL AZ IDEJE!

2. Hivatkozol a SuSE disztibre, hogy ők már átálltak. Szinte az összes, általam adminolt szerver különféle SuSE disztibeket futtat 7.3-9.3 bezárólag. A SuSE megoldotta, hogy vissza tudjak állni UTF8-ról és ha visszaállok úgy is MŰKÖDIK! Gondolom ez a tény elkerülte a figyelmedet.

3. a hangvételed nem igazán kelti egy határozott SZAKEMBER benyomását. Úgy beszélsz az emberekkel, mint a kutyákkal, folyik a szádból a trágyalé, akkora paraszt vagy.

4. Ebből ered, hogy az életben nem fogom használni az UHU-t! Hogyan kaphatok normális supportot, ha csak egy fórumban így beszél a cég képviselője velem/az emberekkel? ( a SuSE ebben nagyon ott van.... ).

5. Volt annak idején egy projektunk, amiből azért DOBTUK KI AZ UHU-t, mert olyan nagyképű supportot kaptunk, olyan szakmai felkészületlenséget tapasztaltunk, ami számunkra nem volt megengedhető, viszont a SuSE képes volt segíteni. ( Funny, nem? )

6. Én eddig támogattam a magyar szoftvereket, de az UHU most az első olyan, akit én BOZTOSAN nem fogok támogatni és ajánlani sem.

Szerintem, öreg, szállj le a magas lóról és töröld meg a nózikádat és próbáld meg a SZAKMÁBAN dolgozó emberek véleményét elfogadni; amivel nem kell egyet is értened. Sajnos az olyan bunkók, mint te rontják el e szakma hírét, magad rontod el a saját és a disztibed imázsát. Szerintem.

Borzasztóan sajnálom, hogy pont egy viszonylag jó, magyar terméket tesztek tönkre a beképzeltségetekkel és nagyképűségetekkel. Eddig bármilyen külföldi szoftverkészítő cégnek írtam support ügyben, ha nem is tudott segíteni DE udvarias volt. Szedd össze magad ember....

Üdv,

Johnny

Aha, tehát neked sem az UTF8-cal van bajod, hanem az UTF8 és ISO párhuzamos használatából adódó kavalkáddal. Ezzel nagyon sokan így vannak, és éppen ezért igyekszik mindenki átállni UTF8-ra, ami az egyetlen megoldás lehet a kavalkádra.

> - szerkessz egy shell scriptet UTF8-ban (szép magyar magyarázatokkal, kiirásokkal) és add oda valakinek.. ha ISO-s a rendszere, csuklani fogsz, de rendesen.

Nem jobban, mint keresztbe irányba ugyanez. Tehát ez se nem az ISO, se nem az UTF8 ellen vagy mellett érv.

> - a konzolok, parancsok nyelve "angol" orientált.

ez esetben tényleg nem tök mindegy? Az angol betűk az összes ISO és UTF8 készletben ugyanazok.

> Mielőtt az észt osztod, hogy mit probáljak ki.. probáldj ki Te egy UTF-es rendszert, amiről 5-10 másik rendszert felügyelsz, amik nem UTF8-asok. Én egyszer "kiprobáltam".. rémállom.

Most UTF8-as rendszert használok, konkrétan pont azt amelyiket a cikkben mások számára is bejelentettük. Erről rendszeresen belépek több szerverünkre, melyek ISO karakterkészlettel dolgoznak. Ha simán ssh-zok, akkor tudom hogy katasztrofálisak az ékezetek. Ha fontos számomra hogy jók legyenek, akkor konvertálni kell, ezt tökéletesen megteszi a "LANG=hu_HU luit ssh gepneve" parancs, ami a bejelentésben is olvasható a Tippek és trükkök részben. Ajánlom neked is!

Lehet hogy a luit kihagyása rémálom, de amikor hullámos meg kalapos ékezeteket látsz a magyar betűk helyett, az nem az? Nem arról van szó, hogy a kétfajta rendszer párhuzamos használata rémálom-e vagy sem, mindnyájan tudjuk hogy rémálom, a kérdés az hogy merre halad a világ és hogy melyik megoldás képes megszüntetni a rémálmot.

> Mielőtt az észt osztod[...]

Kösz hogy kioktatsz, tájékoztatásul közlöm, hogy a Fedora és Suse rég átállt már UTF-8-ra, a Gentoo is elég jól támogatja, a Debian is kezd lassacskán áttérni, mert ezen disztribek fejlesztői mind úgy gondolják, hogy ez a járandó út. Persze jogodban áll nem egyetértened velük...

én csak gratulálni tudok a UHU stábnak, h áttértek az UTF-8-ra. Egy vicc ami 2005-ben megy mo.-n, a kalapos ő és kalapos ű betűkkel.
Nehezen értem meg azokat a rendszergazdákat, akik nem utf-ben telepítik a szervereket.
Programozóként mindig valami nyavalyás trükköket kell kitalálni a rosszul beállított rendszerekre, holott van rá megoldás. Nem igazán értem, mitől is lenne rosszabb az utf-8, hiszen rosszabb esetben semmi változás nem lenne, jobb esetben meg nem kéne szívni minden doksival...

Ami kavalkádhoz vezet, az az UTF8-ra kényszerítés.. és mint lentebb olvason az UHU-val most ez történik, mert ha valaki nem kér a "egyenből" és visszavált latin-ba, akkor a config fájlokkal és egyebekkel fog szivni, de piszkosull..

Szerintem hibás döntés mindent "magyaritani".. a kernelt, a konfig fájlokat és sorolhatnám.. az UTF8-asitás még még hibásabb.

Ha meg valamit megirsz grafikusban, akkor nagyon ritkán kell, hogy szövegesben belepiszkolj.. ha megirsz valamit szövegesben, a legtöbb grafikus szerkesztő megeszi és felismeri a kordolást.. nem értem a problémád.

Ezt a kalapos ő meg ű betűt kifejthetnéd bővebben. Egy olyan Debian Sarge-ról írok, ami ISO-8859-2 van beállítva.

cat /etc/locale.gen

hu_HU ISO-8859-2

A HUP szintén ISO-8859-2-t használ. Most ékezetesen írok neked:

Árvíztűrő tükörfúrógép

Mutas meg, légy szíves, hogy hol látsz kalapos ékezetet.

Senki ne vitatkozzon Egmonttal UTF8-ügyben, fölösleges, kissé vallásháború-szerűen fogja föl. Nem személyeskedésből írom: én egyszer szidni "merészeltem" itt a HUP-on az UTF8-at (megjegyzem, az UHU-nak semmi köze nem volt ahhoz a témához), mire nekem ugrott. :/

Az UTF8-nak megvan a maga helye (pl. GUI és weblapok, ahogy írta följebb valaki) és egy frissen telepített disztróban valóban lehet így kezelni a fileneveket és a szövegfile-ok tartalmát is. Ellenben ha egy meglévő ISO8859-2-es rendszeren frissítesz, akkor utána horrorisztikus élményekben lesz részed. Nekem sikerült ezt egy ügyfélnél egy SuSE upgrade részeként megtapasztalni, hát akkor csuklottak a fejlesztők rendesen. Bár a YaST-ban elég hamar meg lehetett találni és átállítani a rendszer default kódlapját.

Bár igazán a témában a GNOME fejlesztői "alakítottak nagyot", amikor pik-pakk áttértek UTF8-ra és bónuszként még minden mást nekiálltak fikázni. Kicsit érzékenyen érintett a dolog, amikor otthon pl. a GIMP hirtelen nem "látta" a fél home-omat. :I '94 óta linuxozom, engedtessék már meg, hogy ne kelljen egy ilyen miatt minden régi, ékezetes filenevet konvertálnom...

Szóval az UTF8 nem rossz dolog, de nem a Bölcsek Köve. :))

> Nem jobban, mint keresztbe irányba ugyanez. Tehát ez se nem az ISO, se nem az UTF8 ellen vagy mellett érv.
De igen.. mert én még normálisabb os alatt nem találkoztam magyar karakterekkel a config fájlokban.. ne az UHU-bol indulj ki. Az ISO-8859-1-es karakterek meg ugyanazok UTF8 alatt.
> ez esetben tényleg nem tök mindegy? Az angol betűk az összes ISO és UTF8 készletben ugyanazok.
Igen.. ugyanazok.. érdekes, hogy saját Magad cáfolod.. lásd az előző választ.
Amugy szerintem nem.. azért mert Te nem "angol" configokban gondolkozol, mint én.
Azonkivül.. bár ebben nem vagyok biztos.. de érdekesek tudnak lenni az UTF8-as fájl nevek..:))
> hogy melyik megoldás képes megszüntetni a rémálmot.
Freedy mindig visszatér..:)) Tudod, mig a rendszerek 94 százalékán windows- fut és amig a Micro nem támogatja minden szinten az UTF8-at, addig ez is rémálom.:))
> Kösz hogy kioktatsz, tájékoztatásul közlöm, hogy a Fedora és Suse rég átállt már UTF-8-ra...
Elárulom a 8.0-as Red Hat volt az egyik uttörő.. elég sokan dobdák is miatta a diszribet.
Amugy van egy lényeges különbség.. ők nagyjából meghagyják angolnak a konfigfájlokat, a kernelt..

Kedves Johnny!

Örülök hogy kb. 5 helyre is beírtad hozzászólásodat, hogy mindenképp megtaláljam :-) Én csak egy helyre válaszolok, remélem nem gond. Sorra haladva pontjaidon:

1. Szerintem már eljött az ideje. Szerintem. Arról, hogy szerintem van rá igény, a fent belinkelt írásomban olvashatsz. Azt, hogy szerintem technikailag is kellően fel van már rá készülve a Linux, a mostani UHU kiadással igyekszünk bizonyítani. Viszont örülök, hogy a "hibáztatok" és "nem jött el az ideje" kijelentéseket tényként, és nem mind saját véleményedet fogalmazod meg, ellentmondva világszerte több disztribúció és több disztribfüggetlen szakember véleményének, valamint jópár HUP-ozó társadnak is. Bizonyára neked van igazad. Nem tudom, de kíváncsi lennék, hogy a "szerintem" vagy valami ezzen analóg szócskát csak véletlenül felejtetted el leírni, vagy pedig határozottan biztos vagy az igazadban. Véleményeket ütköztetni szeretek. Vitatkozni olyannal, aki csak a saját igazát hajtogatja és nem nyitott új gondolatokra, na azt nem. Nem derült ki számomra egyértelműen, hogy te melyik típus vagy, bár van egy rossz sejtésem. Kérlek cáfolj meg ha félreértelek.

2. UHU-ban is visszaállhatsz, a legtöbb dolog jól fog menni, de van jópár olyan apróság, például a "man" program ahogyan a magyar nyelvű ékezeteket a terminálban megjeleníti, vagy ahogyan a fájlneveket látod, de még pár tucat ilyet szívesen felsorolok ha érdekel, amik a Suse-ban és más disztribben sincsenek megoldva, épp úgy, mint nálunk sem. Az UHU természetesen használható lesz Latin2 módban is, lesznek hibái, kábé annyi mint az 1.2-nek volt ha UTF-8 módra kapcsoltad, azonban azokat a hibákat sajnos, bármennyire is szeretnénk, nem lesz kapacitásunk javítani, mivel általában ezen programok teljeskörű koncepcionális átdolgozását igényelné az hogy a régi és az új karakterkészletet is egyszerre tökéletesen támogassák.

3. Hangvételem csak és kizárólag a beszélgető partner stílusától függ. Sajnálom, de ha valaki látatlanban minősít egy terméket és sokkal rosszabbat feltételez és ezt szinte kész tényként említi, mint amilyen az a termék; vagy valakitől súlyos szakmai tévedéseket olvasok, melyekről nem lehet őt meggyőzni; vagy valaki indoklás nélkül és újdonságok iránti nyitottság nélkül saját megszokott igazát hangoztatja; vagy valaki megkérdőjelez olyan dolgokat melyeket akár még a bejelentésben is elolvashat hogy bizony megoldottuk, akkor előfordul hogy elszáll az agyam. Tudod, ***** helyzet, amikor heteken át szívvel-lélekkel csinálsz valamit, amit te tényleg úgy látsz hogy ***** frankón működik, ezt bejelented, aztán jönnek és látatlanban lehurrogják az egészet, összehordva rá hetet-havat mely feltételezések töredéke sem helytálló.

Mindezek mellett szerintem teljességgel független az, hogy valaki mennyire szakember a témában, és hogy milyen hangvétellel beszélget másokkal. Úgyhogy kérlek, előbbit te se ítéld meg az utóbbi alapján.

4. Aki normálisan kérdez, annak igyekszem legjobb tudásom szerint normálisan válaszolni, függetlenül attól, hogy véleménye egyezik-e az enyémmel. Sajnálom, de nem vagyok az a "keep smiling" típus, aki mindezt a nem normális stílusú emberekkel szemben is mindig meg tudja tenni.

5. Nem, nem funny. Általánosítasz egyetlen konkrét eset alapján. Nyilván volt ilyen. Nyilván volt keresztbe ugyanez is többször, nem nektek, hanem másnak. SuSE alatt egyébként, ha szabad kérdeznem, a nemzetközi céget érted, a régi magyarországi irodát, vagy az új Novell-félét?

6. Szíved joga. Nem akarlak befolyásolni benne, úgyis reménytelen lenne.

7. Vajon te tisztában vagy a SZAKMÁBAN dolgozók véleményével? Azokéval is, akik nem a te véleményeddel értenek egyet? Tudnál neveket mondani (linkekkel, cikkekkel vagy hasonlóval alátámasztva), akik a te véleményedet támasztják alá? Mondjak én szakmabeli neveket, akik szerint az UTF-8 az egyetlen járható út és manapság bőven eljött már az ideje? De legalább köszönet, hogy ebből a bekezdésből egyértelmű, hogy saját szubjektív véleményedről van csupán szó.

8. A magas lóról, beképzeltségről meg ilyesmikről: olvasd már át légy szíves még párszor ezt a fórumot, és jelezd légy szíves, hogy melyek azok a hozzászólások, ahol magas lóról beképzelten és nagyképűen írtam volna bármit is, úgy, hogy az előző hozzászóló a nyilvánvaló baromságaival és saját igazának tényként beállításával és más rendszerből vett rossz tapasztalatokkal vagy ***** screenshottal történő szándékos cukkolással meg ilyesmikkel ne adott volna rá alapos okot az illető. Ja, kérem szépen, lehet hogy itt értjük félre egymást, én úgy érzem, hogy a HUP fóruma nem az, ahol nekem a cég képviseletében kötelességem lenne udvariasnak lennem azokkal szemben is, akik velünk szemben nem azok. Lehet hogy ez hiba részemről. Ezt majd cégen belül a többiekkel megbeszélem...

No és mielőtt valaki elkezdi a száját tépni, hogy miért nem konvertálom otthon a fileneveimet :))), fölhívnám egy aprócska tényre a figyelmét: a Linux sok minden más előtt elsősorban a választás szabadságáról szól. Ha én latin2-es kódlapot akarok használni, akkor hadd használjak azt (még ha szívok is vele egyesek szerint). Ne akarja a disztribúció helyettem kitalálni, hogy mi a jó nekem.

Ott a pont, bár ez nem változtat azon, hogy úgyis le leszel finoman hülyézve. ;)))))

fdavid, észrevételeid nagyon jók, éppen ezért váratott mostanáig az átállás, miközben már komoly előkészületeket tettünk, vagyis szinte mindenhol, ahol a latin2 és utf8 mód helyes működése egyszerre megoldható, már az 1.2-ben jól támogatjuk az utf8-at is.
Az 1a)-ban írt dolgokat (fájlok tartalma, beleértve például konfig fájlok megjegyzései, man oldalak, dpkg csomagleírások) most konvertáltuk.
1b) disztribszinten alig egy-két hibás fájlnév akadt, amit javítottunk, sajnos a felhasználó saját ékezetes fájlneveinek átalakítása az ő feladata lesz.
1c) Hálistennek egyre kevesebb, és ami ilyen, azt is igyekszünk eltusolni (wrapper programmal latin2 módban indítani). Emiatt korábban nem nagyon tudtunk volna átállni, meg kellett várni azt, amíg az alkalmazások túlnyomó többsége már támogatja az utf8-at, vagy legalábbis valamely vezető disztribúció jóvoltából létezik hozzá patch.
2. Kompatibilitási problémák persze hogy lehetnek, a levelezésben nem annyira, mivel minden levél megnevezi a saját karakterkészletét, és amelyik levelezőprogramnál csak lehet (értsd: mutt és nail), beállítottuk, hogy ha a levél kódolható iso8859-1 vagy -2 készlettel, akkor arra konvertálva küldi ki, elősegítve az utf8-at nem ismerő kliensek működését.

Szóval tényleg nyilván nem lehet teljesen zökkenőmentes az átállás, de én is már baromi régen át akartam állni, most láttam elérkezettnek az időt, amikor már valószínűleg a lónak ezen az oldalán kevesebb a szívás.

> Nehezen értem meg azokat a rendszergazdákat, akik nem utf-ben telepítik a szervereket.
Lehet azért mert nem akarnak szivni?:))
Tutod a világ meg volt eddig is UTF8 nélkül.. érdekes modon még müködött is. Ha valaki hozzászokott és biztosan kezeli az osdi, elavult ISO-s rendszerét,
miért váltson UTF8-ra.. azért hogy elmondhassa:
haladok a korral?:))

Trey, használtál már grafikus felületet is bennük magyar szöveggel? Ne mondd már, hogy nem találkoztál még hullámos meg kalapos "magyar" ékezetekkel, mert nem hiszem el. Ablakkezelő menüjében, ablak fejlécében, progik menüjében stb...
De ha esetleg tényleg nem, akkor vajon egyéb idegen nyelven (nem angolul) szoktál ékezetesen kommunikálni másokkal? Mondjuk franciául, olaszul, oroszul...? És az ő ékezeteikkel mi lesz?

Igen, a választás szabadsága... tudod, ha megnézed commits levlistánk utolsó kb. 100 commitját, ami az UTF-8 átállás mostani szakaszáról szól, látni fogod, hogy ezen módosítások túlnyomó része 10-szeres, 100-szoros, ki tudja, talán 1000-szeres munkaigényű lett volna, ha párhuzamosan akarnánk mindkét karakterkészletet támogatni.

Szép dolog a szabadság a felhasználó szubjektív lelkivilágát érintő kérdésekben. De sosem értettem azokat, akik a választás szabadságát kérik igencsak kemény technikai kérdések terén. Például a cp parancs kapcsolóit nem akarod másmilyenekké átdefiniálni magadnak? Vagy az mc-t átkeresztelni mv névre, az mv-t meg mc-re?

Hidd el, eltelik néhány év, és nem igazán lesz disztrib, amely használhatóan támogatná még a régi karakterkészleteket. Előbb-utóbb menthetetlenül át kell állnia mindenkinek. Szerintem akkor jár a legkevesebb szívással az átállás, ha az általad használt disztrib átállásával egyidővel teszed meg.

Hasznalok grafikus feluletet (Blackbox), de nem igen emlekszem olyanra, hogy valahol nekem ekezet problemaim lettek volna. Konzolon van ekezetem, ssh-n keresztul szepen tudok ekezetesen irni, az a minimalis menu ami a Blackbox-ban van, az nekem _jol_ ekezetes. Nem allitom biztosra, hogy nincs a gepemen olyan program amiben nincs hiba, de ha van, akkor azt marha ritkan kell hasznaljam, mert nem tunik fel.

Szoval csak azt tettem szova, hogy nem kene az ISO-8859-et ugy beallitani, mintha a csak kalapos betukre lenne kepes, mert egyaltalan nincs igy.

Aki nem kér az UTF-8-ból, az ne kérjen a következő UHU-ból sem. Nem kényszerítünk senkit. Ezt nyújtjuk, egy modern, a mai kor igényeinek eleget tevő rendszert. Akinek tetszik az használja, akinek nem az meg nem.
A konfig fájlokban kizárólag megjegyzésként vannak kommentek, amiket most átkonvertáltunk másmilyen ékezetekre, és a te elképzeléseiddel ellentétben ezt úgy tettük meg, hogy az UHU-ban minden környezetben (konzol, terminál emulátorok) és minden szövegszerkesztőben alapból helyesen jelennek meg az ékezetek. Ezzel mi bajod van?
Mindemellett könnyen lehet, hogy a nemzetközi irányba nyitás következő lépéseként kivágjuk a magyar megjegyzéseket és angolokat rakunk helyettük, ez esetben úgysem lesznek ékezetes betűk.
Miért fáj neked, ha azon igyekezünk (és igencsak jól állunk vele), hogy csináljunk egy olyan rendszert, ahol az ékezetes betűk kezelése terén történetesen minden konzisztens és minden mindennel klaffol és minden magától jól működik?

> Az ISO-8859-1-es karakterek meg ugyanazok UTF8 alatt.
Ez egy hatalmas szakmai tévedés, javaslom, hogy tájékozódj egy picit az UTF-8 témakörben (például fent linkelt doksimat olvasd el, ahol példaképp egy ISO-8859-1-beli karaktert UTF-8-ra alakítok), mielőtt érdemben tovább tudnánk társalogni.

> Amugy szerintem nem.. azért mert Te nem "angol" configokban gondolkozol, mint én.
Akinek elegendő az angol nyelv, annak az ISO-8859-1, ISO-8859-2 és UTF-8 teljesen egyenértékűek, tehát nem értem, miért fájna egy UTF-8-ra átállás, miközben nyilván számára előnye sincs.
Az UTF-8 átállás az ékezetes betűk kezelésével kapcsolatos számtalan hibát hivatott megoldani, nem az angol betűkét.

> Azonkivül.. bár ebben nem vagyok biztos.. de érdekesek tudnak lenni az UTF8-as fájl nevek..:))
Ebben tényleg nem vagy biztos, sőt.. Egészen addig furák, amíg az UTF8-as fájlneveket nem UTF8-as rendszer jeleníti meg. De ha az UTF8 fájlneveket UTF8 rendszer jeleníti meg, akkor tökéletesen látszanak mindenütt. Ez a cél. Nem az a cél, hogy olvashatatlan többkarakteres krixkraxok legyenek mindenütt, hanem az, hogy pont az a karakter látszódjék mindenütt, aminek látszódnia kell. Erről szól az UTF8, de szerintem ezt te tök nem érted.

> Elárulom a 8.0-as Red Hat volt az egyik uttörő.. elég sokan dobdák is miatta a diszribet.
A Red Hat nagyon sok ilyesmi szempontból úttörő, ami miatt valóban ***** is sokszor, ők azok, akik húzzák előre és fejlődésre kényszerítik az alkalmazásfejlesztőket és a többi disztribet is. Ha a Red Hat 8.0 nem UTF8 lett volna, valószínűleg mi most sok évvel később nem tudnánk átállni. Szerinted egy sok évvel ezelőtt kísérleti jelleggel UTF8-azó, és egy ma már viszonylag kitaposottabb utat járó disztrib ugyanazt nyújtja? Ne ítélkezz az UHU-ról légy szíves egy sok évvel ezelőtti másik disztrib alapján. Nézd meg az UHU-t, keress hibás ékezetet benne, és utána nyilatkozz!

Nesze neked utf8:
lol-at-utf8.png [khiraly.4242.hu]

Khiraly

Jó, képes, de csak egy (bocs, kettő) a sok ISO-8859 közül, a többi nem. A többi viszont másmilyen (idegen nyelvekben használatos) ékezetekre nem képes. És nagyon sok szoftver van, aki (mivel fingja nincs, hogy melyik ISO-8859-et kéne választania) rosszat választ, ezáltal hibásan jeleníti meg az ékezeteket.

> Tutod a világ meg volt eddig is UTF8 nélkül.. érdekes modon még müködött is.
Működött és működik is, sokszor jól, sokszor hibásan. A cél nem más, mint a hibák kiküszöbölése. A cél elérése érdekében az eszköz az UTF-8.

Szia!

Végre, normális a hangvétel és köszönöm. NEM volt célom, hogy kellemetlen helyzetbe hozzalak, hisz magam is tudom milyen az, amikor sok munka után lesz**ozzák az ember munkáját. Azonban Te is biztosan jól tudod, hogy ez egy ilyen szakma. Sokszor rettenetesen hálátlan; nehéz jót és megfelelőt alkotni. Engem a hangvétel dühített fel, amit alkalmaztál. Ha pedig nem vagy "keep smiling" személyiség, akkor pedig NE Te képviseld az UHU-t a nagyvilág előtt, mert a dologból csak a disztrib lejáratása lesz.( lett ). De ez az ÉN véleményem, semmi több. :-)

Az UTF8 és ISO karakterkészletek szerintem két teljesen külön táborra osztják a rendszergazdákat és a felhasználókat. Világos, hogy rendet kell tenni, de a SuSE-nál is valószínűleg a megosztottság miatt adatik meg a lehetőség a be- illetve visszaállításra.

A szakmában dolgozók véleményével csak olyannyira vagyok tisztában, amennyire nap mint nap találkozom velük: rendszergazdák, fórumok, how-to-k, stb. Én ebből ítéltem meg és hoztam fel a 100%-os UTF8 alkalmazásának hibáját. A vélemény a sajátom, támaszkodva az imént említettekre. Kérlek, nézd el pontatlanságomat, ami a felfokozott és rögtönzött kirohanásnak tudható be. Sajnálom.

Én nem szeretnék vitát nyitni a dologból; nem akarok Veled rossz kontaktust még erre a kis időre sem. Én elmondtam a véleményemet és nincs több célom vele.
Nem akarok hivatkozni senkire és semmire. Én a munkámat végzem reggeltől-estig és ezért megfizetnek, hol tisztességesen, hol kevésbé.

Tudom, rosszul esik, hogy támadólag lépnek fel Veled szemben vagy "nyilvánvaló baromságaival " fáraszt egy hozzászóló. Én naponta több olyan telefont kapok, amitől feláll a szőr a hátamon és az akut agyvérzés kerülget:

"- a haverom mondta, hogy......",
"- de hát ez a kutyám gépén működik...",
"- elküldtem egy mélt ésazt az üzenetet kapom, hogy: 'unknown user', elromlott a mélszerver?..... "

hogy csak a krémjét említsem. DE - és ez az én MAGÁNVÉLEMÉNYEM ismét - akkor sincs jogod az ilyen embereket ennyire lenézni. Világos, én is anyázok sokszor, de nem teszem azt bele a világ arcába. Nem akarlak kioktatni, ne haragudj!

Üdv,

Johnny

> az a minimalis menu ami a
> Blackbox-ban van, az nekem _jol_ ekezetes.

Hmm, nekem viszont fluxboxban en_US.UTF-8 -as LANG beállítások mellett
ha egy weboldal címe ékezetet tartalmaz, akkor a wm befürdik vele, csak
addig írja ki az ablak címébe amíg el nem jut az első ékezetig. Ez
fonttól független probléma, mindegy milyen fontot állítok be a fluxboxnak.
hu_HU-nál működik a dolog, de nem szeretem ha magyarul beszélnek a
programok, szóval eddig még nem találtam erre megoldást.

Meg lehet szokni. Sot lehet vegyiteni is a kettot.

Pl. en latexben is irtam magyar-francia irast. Teljesen megszoktam, hogy a r` az igazabol e`, stb.
Engem mar a vegere nem is zavart;)

Termeszetesen ha rendszeresebben csinaltam volna, akkor ezeket a problemas betuket kicsereltem volna a konzolom fontkeszleteben.

Khiraly

Na akkor pofa befog, UHU-1.2 UTF-8 snapshot telepít, mc elindít (linux konzolban, xterm-ben, gnome-terminálban, konsole-ban), screenshot készít, azt küldd be ide ha kérhetném!

Tök nehéz felfogni hogy NEM az a célunk, és nem is ott tartunk, mint amit ez a screenshot is mutat?

Vagy spóroljak neked időt és küldjek screenshotot én? Szívesen megteszem ha kéred! El tudod képzelni, hogy a táblázatkarakterek és a magyar ékezetek terén tök ugyanúgy néz ki, mint a régi megszokott ISO-8859-X rendszerben az mc, csak mellesleg még egyéb extrém karaktereket is meg tud jeleníteni?

Mint a cikkben írtuk, mi is tudjuk, hogy a fluxbox ablakkezelővel vannak gondok.

Elso szivasok egyike, hogy fajlnevben NINCS ekezet.
Aki ezt nem fogja fel, az meg is erdemli.

Probalt mar valaki elhalt wines particiot visszahozni? Nekem az o" es u" ekezetes fajlok kivetelevel sikerult. Azota se (igaz azelott se) hasznalok ekezeteket a fajl neveben. Marhasag. Majd 20 ev mulva amikor mar a windows es a linux is ugyanugy kezeli ;)

Szoval aki ekezetes fajlneveket ir, az meg is erdemli. Vesszen a luzerje.

Khiraly

Az jó. És a francia kalapos u (û) kontra magyar ű esetében mit csináltál volna a fontkészlettel? Neadjisten valamiféle kompatibilitásra igény, hogy a tex fájl mások gépén is oké legyen?

Rossz a fenet. Csak pont ez az utf8 hype ami most megy, bezavarja a normal halandok eletet.
Ide is beszurom, hogy lasd, mennyire idegesito tud lenni:
lol-at-utf8.png [khiraly.4242.hu]

Nem haragszom, inkább már csak jót derültünk (többen) ezen a "levezető" beszóláson, hiszen a nagy flamehullám lezajlott már, viszont ez igencsak ütősebb volt a többinél.

Az UHU képviseletéről: általában nem én képviselem, itt most olyan szakmai változásról volt szó, amely mögött (habár ez elvileg tök nem számít, de gyakorlatilag például a commits listáról úgyis kiderül) lényegében egyedül én álltam, nem csoda talán, hogy figyelemmel kísértem a hupos hozzászólásokat, annak pedig abszolút nem örültem, hogy több ízben olyan irányt vett a téma, amilyet. Az elején normálisabb kérdésekkel indult, megpróbáltam normálisan válaszolni, aztán amikor tömegével jöttek a baromságok és az alaptalan fikázások, akkor lehet hogy hagynom kellett volna a francba és emelt fővel elvonulni, hadd higyjék mások hogy hűde nagyot alkottak és hogy igazuk volt hogy milyen ***** az UHU meg az UTF-8 amit ki sem próbáltak, mégis úgy voltam vele, hogy ami nyilvánvalóan tévedés vagy téves feltételezés vagy rágalom, azt cáfolni akartam, elsősorban a normális emberek objektív tájékoztatása céljából, persze a hangnem nem ilyenre sikeredett, azt mindig az aktuális hosszászóló alakította ki bennem.

Az emberek lenézéséről: nagyon remélem hogy nem néztem le senkit, maximum leugattam, elküldtem a francba, ez szerintem más, fene tudja, nehezen meghatározható fogalmak ezek. Kettőnk közt viszont a párhuzam nem kóser: téged privát csatornán anyáznak (ahogy számomra kiderült), naná hogy nem teregeted ki a nagyvilág elé ezt a szennyest. Itt viszont nyilvánosan érte több teljességgel alaptalan támadás és teljességgel megalapozatlan rosszindulatú fikázás az UHU-Linux disztribúciót, meg aztán személyesen engem is, ezekre szerintem nem elítélhető ha ugyanitt reagálok.

Jo akkor pofa befog, es ssh-n keresztul jelentkezz be erre az uhu-s gepre. Mondjuk egy debian stable-rol.

Linuxok jo reszet tavolbol (remote) hasznaljak.

Khiraly

Ide is beszúrom, olvasd el lejjebb, idegesít amikor olyanokkal kell társalognom, akiknek nyilvánvalóan fingjuk nincs arról hogy miről is van szó. Szerinted ha az UHU-ban így nézne ki az mc, akkor csinálnánk iso-t, írnánk bejelentést, beküldenénk a hup-ra? Komolyan ezt nézed ki belőlünk? Nézzél már magadba!

Talán ha nem feltételeznéd, hogy "magától" megtörténik a konverzió két különböző karakterkészletet használó gép között, hanem utánajárnál, és akár a mi bejelentésünkben is elolvasnál több lehetséges megoldást is, mint például a luit vagy a screen, és használnád azokat?

A visszaállító progi wines vagy linuxos volt? Furának tartom az esetet, mivel a win UTF16 kódolásban tárolja a fájlneveket, ami az angol betűk és az ékezetes magyar betűk esetén egyaránt 2 byte, az ő és ű betű csak abban különbözik hogy a magasabb helyiértékű byte nem 0, hanem 1. Tippem szerint (abszolút látatlanban) a helyreállító progi volt a *****.

Sajnálatos hogy csomó helyen még nem gördülékeny az ékezetes nevek támogatása, ugyanakkor hozzáállásoddal nem értek egyet. A fejlesztők feladata megoldani, hogy az ékezetek mindenütt jól működjenek. A fejlesztők és a számítógép vannak a felhasználókért. Nem fordítva.

In article <42.52380@c.hup.hu>, egmont wrote:
>> Az ISO-8859-1-es karakterek meg ugyanazok UTF8 alatt.
> Ez egy hatalmas szakmai tévedés

Egmont! En a helyedben inkabb ugy fogalmaznek (hogy a hupperek is ertsek),
hogy "hulye vagy gyermekem".

--
Gabucino

Gabu, igazad van, de akkor maradjunk inkább a "kicsi vagy még szájbergyerek" megfogalmazásnál...

> Ez egy hatalmas szakmai tévedés, javaslom, hogy tájékozódj egy picit az UTF-8 témakörben
Szakmai tévedés? Már bocs, de biztos nem csak össze vagdostad azt a doksit ész nélkül?:))
Egmont idézek belőle:
> Kompatibilis az ASCII-val. Angol szöveg UTF-8
> ábrázolása megegyezik annak ASCII (vagy Latin-1
> vagy Latin-2 stb.) ábrázolásával.
> Az ASCII karaktereket egy byte-on, önmagukkal
> reprezentáljuk, ezek tehát 128 alatti értékű byte-ok
"Nagyjából" én is igy tudom.. ugyhogy érdekes ez a > szakmai tévedés duma.:))

Föleg azért mert két sorral lejjebb cáfolod Magad..

Egmond, nekem semmi bajom azzal, hogy az UHU átáll UTF8-ra, mert eddig sem használtam ,azután sem fogok UHU-t használni.. sőt még egy darabig UTF8-as rendszert sem.
Hogy az egyik barátom idézzem:
> En nem szaraxom sem az utf 8al, sem az uhuval :D
Fri

Bár nem kalapos ékezet, de kíváncsi vagyok: Mi történik akkor, ha valaki gonosz módon olyat merészel beírni, hogy ä, ë, ê, ç, ß, vagy esetleg ř?

Rámutatnál _konkrétan_ azon kijelentésemre, amely szerinted szakmai tévedés? Merthogy én rámutattam, te meg csak "két sorral lejjebb", ja melyik doksiban, mihez képest, mekkora betűmérettel és ablakszélességgel?

Egyébként ne vedd sértésnek, de megtisztelnél, ha vennéd a fáradságot, hogy ha már a nevemen szólítasz, akkor legalább helyesen írnád azt.

Gabuci tanulj már meg olvasni Egmont-al együtt..
A csak ISO-8859-1-es karaktereket tartalmazó fájlok ugyanugy szerkeszthetők egy UTF rendszeren, mint egy ISO-s rendszeren, és használhatók maradnak. Forditva nem igaz.
Erre vonatkozott a mondatom nem másra.
Sajnos (UHU-s) fanatikusokkal elég nehéz értelmesen
beszélni.. hugyagyuak.

Bocs, az előbb nem olvastam eléggé figyelmesen írásod, asszem mégiscsak beidézted, szóval:

Angol szöveg (igen kevés kivételtől eltekintve) nem tartalmaz ékezeteket, kizárólag ékezet nélküli karaktereket. Ezek az ASCII, ISO-8859-1, ISO-8859-2 vagy UTF-8 kódolások mindegyikével ugyanahhoz a csupa 128-nál kisebb byte-okból álló bytesorozathoz vezetnek.

Az ISO-8859-1 ezeken a betűkön felül a nyugat-európai nyelvek ékezetes betűit is definiálják. Ugyanezen betűk UTF-8 ábrázolása különbözik az ISO-8859-1 ábrázolástól.

Mi az ami ebben nem világos vagy nem helyes szerinted?

Adi, csak annyival egészíteném ki.. hogy szerintem
(UHU-s) fanatikusokkal ne beszélgessen az ember.. :))

"1b) disztribszinten alig egy-két hibás fájlnév akadt, amit javítottunk, sajnos a felhasználó saját ékezetes fájlneveinek átalakítása az ő feladata lesz."

Van esetleg valami scriptetek, ami megkeresi a vinyón azokat a file-okat, amelyek neve nem UTF-8-as karaktert is tartalmaz, és átnevezi a megfelelően konvertált UTF-8-as névre?

Jah, azok. Megcsinálnak egy rendszert, ahol minden klaffol mint állat, ennek érdekében rakat progit megpatchelnek, mindezt nyilván úgy, hogy szakmailag fingjuk sincs hogy miről beszélnek, csak véletlenül ütik le úgy a billentyűket, hogy látszólag valami értelmes kerekedik ki belőle. Nemcsak hugyagyúak, de irdatlan mázlisták, ennyi mázlival már rég elvihették volna a lottó ötöst, mennyivel jobban is jártak volna, soha többé nem fórumoztatnának náluk sokkal jobban hozzáértőkkel.

Az ISO-8859-1 karakterkészlet _ékezetes_ betűinek totál más a kódjuk ebben a rendszerben, mint UTF-8-ban. Szerinted nem így van? Na jó, akkor egy keresztkérdés: az ISO-8859-1 mind a 256 byte-nak megfeleltet valamit, akkor szerinted hol van lehetőség bővülni és további karaktereket is beiktatni, ha az UTF-8 ezt egészíti ki?

Imádom az olyan embereket, akik nyilvánvaló hülyeségeket hangoztatnak, amiről fél perc guglizás során meggyőződnének hogy hülyeség, de annyi minimális önkritikájuk sincs, hogy egy pillanatra is megkérdőjelezzék saját állításukat és utánanézzenek.

> Szoval aki ekezetes fajlneveket ir, az meg is erdemli. Vesszen a luzerje.

Íme egy hozzászólás 2005 szeptember 14.-én.
Fenébe, hogy már több mint 10 éve csak a *****ás van ezzel. Pedig már majdnem úgy tűnt, hogy jó lesz, aztán mégsenem.

Igen, convmv a neve, alapból települ, kezd viszonylag standard progi lenni (egyre több disztribben megtalálható), a bejelentés szövégében használsz egy példa parancssort, a többi részlet a man page-ben olvasható.

Ezzel semmi.. fentebb irtam:
A csak ISO-8859-1-es karaktereket tartalmazó fájlok ugyanugy szerkeszthetők egy UTF rendszeren, mint egy ISO-s rendszeren, és használhatók maradnak. Forditva nem igaz.
Erre vonatkozott a mondatom nem másra.

De más is volt ott..:)

Azt csipem az UHU-sokban, hogy mindent
meg/be akarnak magyarázni.. csináljátok.
Én csak a véleméynem irtam le.. szivok továbbra
is a nem UTF-s rendszereimmel.:)

Frimen, Te kezdted a beszélgetést, nem mi! Ha nem kívánsz beszélgetni, elhúzhatod a csíkot, senki nem fog megharagudni emiatt (én legalábbis biztos nem) :-) Mindemellett majd ha lesz fél percet, utánanézhetnél hogy az ISO-8859-1 és az UTF-8 valóban kompatibilisek-e egymással, örülnék egy linknek ahol meggyőzöl erről (merthogy én bármikor meggyőzlek az ellenkezőjéről, csak ezt te nem hiszed, mert beskatulyáztál az "UHU-s fanatikus" kategóriába).

s/használsz/találsz/
bocsi már hülyeségeket írok...

> A csak ISO-8859-1-es karaktereket tartalmazó fájlok ugyanugy szerkeszthetők egy UTF rendszeren, mint egy ISO-s rendszeren, és használhatók maradnak.

Ezen állításod nem igaz. Az ISO-8859-1 és UTF-8 nem kompatibilisek. Hogy miért nem, arra például fent belinkelt leírásomban megnézheted a példaként említett ó betű kódját mindkét rendszerben.

Azt csípem benned, hogy egy napnál is világosabban tisztán fekete-fehér megválaszolható eldöntendő kérdésben ragaszkodsz a saját vélt igazadhoz, amivel csak az a baj, hogy történetesen nem igaz. Csak picikét utána kéne nézned és rájönnél.

Köszönöm. A bejelentésben valahogy sehogyse sikerült észrevenni...

Igy van, igazad van.. az ISO-8859-1 karakterkészlet _ékezetes_ betűinek totál más a kódjuk ebben a rendszerben, mint UTF-8-ban.. de látom még mindig nem fogtad föl, én nem az ékezetes betükről irtam eddig.
Erre irtam a két malmot is.
> akkor szerinted hol van lehetőség bővülni és további karaktereket is beiktatni, ha az UTF-8 ezt egészíti ki?
A grafikus felületen UTF8-ban.. a konzolon nincs sok értelme "bővülni".. szerintem.
> Imádom az olyan embereket, akik nyilvánvaló hülyeségeket hangoztatnak, amiről fél perc guglizás során meggyőződnének hogy hülyeség, de annyi minimális önkritikájuk sincs, hogy egy pillanatra is megkérdőjelezzék saját állításukat és utánanézzenek.
Detto.. iműdom az olyan embereket, akik anélkül, hogy ismernék a másikat, hogy mivel fogllakozik lehülyézik..:))
Ha meg nem áll be a sorba, rögtön megprobálják tériteni..:))

Egmont.. előbb takarits ki a sajád házad táján, utána gyere nekem önkritikával.

Mer' mi tortenik?

Ez komoly, hogy a less-ben nem lehet keresni UTF-8-as karaktereket és
eddig még nem is vettem észre :)

Lefutott. A --notest kapcsolót sem sikerült észrevenni... ((;

Ide is leirom hátha eljut a szürkeállományodhoz: NEM az ISO-8859-1 ékezetes karaktereiről beszéltem eddig sem.
Itt csak az a "baj", hogy nagyon két malomban örölünk.. Te nem tudsz elszakadni attól, hogy mindenbe belepiszkálj és magyarosits.. és meg attól, hogy ezt a legnagyobb baromságnak tartsam.:)

Egmont: sok sikert!

> de látom még mindig nem fogtad föl, én nem az ékezetes betükről irtam eddig.

Nem, valóban, én csak azt tudom elolvasni, amit leírsz, azt nem, amire mögötte gondolsz. Nemtomhányszor leírtad, hogy az ISO-8859-1 és az UTF-8 ugyanaz, ami így nem igaz, csak az imént tett kiegészítéseddel: az angol betűk terén ugyanaz, naná.

Azt pedig abszolút nem értem, hogy ha te nem használsz ékezeteket, akkor mi bajod van egy olyan változtatással, ami a legkisebb mértékben sem érint téged, hiszen csak és kizárólag az ékezetes betűk kezelésére vonatkozik? Miért fáj neked ha egy konzol is UTF8-as, ha te egy szem ékezetet nem szándékozol látni rajta? És ez esetben miért fontos neked, hogy míg a grafikus felület már UTF-8-azik, addig a konzol maradjon (általad nem látott módon, hiszen te nem használsz ékezeteket, de azok számára akik használnak) szándékosan inkompatibilis vele?

Nem, eszünk ágában sincs eljátszani azt, hogy ami ékezet az egyik helyen látszik, az a másik helyen ne látszódjon. Csak és kizárólag az az egyetlen cél vezérel minket, hogy minden ékezet mindenhol (ott is ahol te nem akarnád használni) tökéletesen játszódjon. Erre a célra a Latin-2 nem bizonyult elegendőnek, előbb-utóbb váltanunk kellett az UTF-8-ra, és nyilván ezt úgy tettük meg, hogy a szöveges konzolt is átállítottuk UTF-8-ra, így az újfajta ékezetes betűk ott is szépen látszanak, pont ugyanúgy, mint bárhol máshol.

Amennyiben neked, aki soha nem találkozik ékezetes betűkkel a konzolon, fontos hogy a konzol mégis másképpen kezelje azokat, mint a grafikus program, hát legyen, nem akadályozlak meg ebben, úgysem UHU-t használsz :-), csak érteni speciel csöppet sem értelek.

elvileg az xfce-terminalom is utf-8 as.
Ez van.

OK, szerintem is rendeztük a dolgot és a végére még az "első benyomás" adta kép is megváltozott Rólad; pozitív irányba. Csak ne lett volna az eleje.....:-(

Magam is remélem, hogy a nyelvi probléma egyszer végleg megoldódik, hisz az UTF8 adhat megoldást a sokszínűségre ( hacsak a kínaiak túl nem szárnyalják az Unicode nyújtotta lehetőségeket; ha jól tudom 16384 hely nekik van félretéve a palettában :-D, de ebben nem vagyok biztos ).

Sok sikert kívánok az új UHU-kiadáshoz, ha megjelenik a stabil, azért megnézem, mint ahogyan eddig az összeset......

Üdv,

Johnny

1. Sehol nem irtam olyat, hogy az ISO-8859-1-es kompatibilis az UTF8-al..
2. Nem kezdtem beszélgetést, csak a véleményem irtam le, de nem csipen ha valaki hittéritőzik.. az UHU-sok meg erre elég hajlamosak.
3. "Elhuzom", mert meddő a dolog.. eddig sem használtam UHU-t, ezután sem fogok, de..
.. sok sikert, mindentől függetlenül.
Fri

ISO-8859-1 helyett ASCII-7 -et vagy US-ASCII -t kellett volna irnod. Azok a 7-bites fajlok, amiben nincsenek ekezetek es utf-8 es iso alatt is jol jelennek meg.

Persze ahogy irtad, arrol kitunt hogy errol beszelsz, nem ertem, hogy masok miert akadtak fenn rajta.

Kapcsolodo link
http://en.wikipedia.org/wiki/ASCII

Probaltal mar .tex fajlt utf-8ban irni?

Ha igen, akkor most nem tenned fel a kerdesedet.

Khiraly

Kedves Frimen!
Megértem, ha számodra közömbös a téma és tök nem érdekel hogy működnek-e az ékezetek.
Nem értelek viszont akkor, amikor bizonyos tekintetben kifejezetten ellene vagy bármiféle erre irányuló tevékenységnek.
Rengeteg olyan változáson mennek át a Linux disztribek, amik meg engem nem érdekelnek csöppet sem, de mégis, hadd legyen! Ha téged nem érdekelnek az ékezetek, akkor fogadd el, hogy világszerte nagyon-nagyon sok szakértő egyetért abban, hogy viharos gyorsasággal át kell állni mindenütt UTF-8-ra, mert csak ez lehet a megoldás a hibás ékezetekre. Téged nem érint, ezért téged nem édekel, oké, de ha már közömbös számodra, akkor örülnék ha nem zavarna hogy ez történik. :-)
Asszem (talán) kezdjük nagyjából megérteni egymást, én meg ma még semmi értelmeset nem csináltam, szóval asszem lassan lezárhatnánk ezt a témát, okosabbak már úgysem leszünk. Remélem azért nincs harag :-)

Sajna komoly. Suse-nak van rá patche, de az meg más dolgokat (például a vízszintes szkrollozást) elrontja. Beraktam már rég a bugzillájukba, de még nincs rá javítás. A less szerzője is tud róla, ő sem javította még.

Hittérítés? Hol? Csináltunk egy új verziót, úgy érezzük hogy komoly változás történt, ezért bejelentettük, leírtuk hogy hol tartunk, mit csináltunk, mi van még hátra. Ebben hol a hittérítés?
Én tényleg nem látom, de lehet hogy én vagyok a vaksi...

Igen, sima linuxos bootCD volt kb. 3 v. 4 eve.

Persze gondolom az volt a *****, vagy en a lama. Lenyegtelen ekezet nelkul nem lett volna szivas.

A fajlnevekbe kar eroltetni az ekezesitest. Btw, find, sed, vi, perl is kezeli normalisan az utf-at. A locate is?

En az utf-8 at foleg a regexp-ek miatt ellenzem. Valahogy sose akarnak mukodni. Fajlnevekben semmikep se.

Fajlokban persze lehet, de azt mindenki dontse el, hogy eleg neki a latin2, vvagy pedig az utf8-at preferalja. Es a szovegszerkeszto meg igenis irja ki, hogy most ez a fajl miben van kodolva. Es ha mondjuk masik rendszer alatt belenyul mcedit-tel vagy valami gagyi szovegszerkesztovel, akkor ismerje fel a teves karaktereket (pl. piros hatter) hogy javitani lehessen.

Most egyelore az van, hoyg utf-8 as fajlt gyonyoruen lehet olvasni iso rendszer alol (csak meg kell szokni), forditva meg az ekezetek helyett fekete potty van (vagy kerdojel), amit nem lehet olvasni.

Khiraly

A böngésző a beírt karaktereket az oldal karakterkészletére (jelen esetben Latin2-re) alakítja, illetve az abba nem beleférő karaktereket &szám; konstrukcióval helyettesíti, amik (ha a motor az & karaktert nem escape-eli ki) a html oldal megtekintésekor jónak látszik.

> Btw, find, sed, vi, perl is kezeli normalisan az utf-at. A locate is?
find, sed, vim, perl: igen, szépen ismerik az utf8-at.
locate: mivel string compare-t végez, az egyetlen kritikus pont a case insensitive mód. Most fut az updatedb, majd beszámolok róla ha végzett.

Kedves khiraly!
A jelen kiadás bejelentésében is olvasható, hogy mi a teendő, ha .tex fájlban utf8 kódolást kíván valaki használni.
A teTeX terjesztés 2-es verziójához még külön csomagot kell telepíteni, a 3-as már magától támogatja az [utf8]{inputenc} csomagot.
Egyébként a tavalyi tanévben a BME-n vezetett gyakorlatom összes feladatsora, körülbelül 20 darab, tavaly szeptember óta mind utf8 kódolásban készült. Nemcsak a magyar ékezetek, hanem a magyar tipográfiának megfelelő idézőjelek és nagykötőjelek is utf8 kódjukkal szerepelnek benne, nem a TeX-féle escape szekvenciákkal.
A fájlok szépen lefordulnak, minden tökéletes, az egyetlen bosszantó dolog, hogy ha hibás a tex fájl, akkor a terminálra escape-elve írja ki a byte-okat, ahelyett hogy nyersen kiköpné az utf8-at.

Es most mi a problema ezzel? Es mennyire van jelentosege ennek ezen az oldalon?

Ertem en mire megy ki a jatek. Kerdes, hogy szamomra (magyar ember szamara) mennyire fontos, hogy tudjak francia u-t meg nemet mittomen mit irni. Attol felek semennyire.

Mondjuk ettol nekem nem faj, hogy az UHU ezzel tolti az idejet. Mint mar korabban emlitettem, csak azert szoltam, hogy ne bizonygassuk boszen, hogy az ISO = kalapos űő, mert k nem igaz.

Köszi :)

Nem az. Nincs azzal baj, hogy az UHU ezzel foglakozik.

Na, a locate --ignore case opciója nem jó, legalábbis az uhu-ban lévő nem túl friss verzióban. Majd utánanézünk az újnak és jelezzük a fejlesztőnek.

Kedves Egmont!
Nincs harag.. nem zavar(t).
A NET kiválóan alkalmas arra, hogy
bolhából elenfántot gyárson azzal, hogy "kicsit"
szükkebb a sávszélessége az emberi beszédhez képest.:))

Jelen HUP fórum esetén tök jó a latin2, és speciel véletlenül még a latin2-ből kieső karakterek is escape-elődnek oly módon hogy lesz. Az utf8 ennél sokkal többről szól, nem az a célja hogy egy szem webes fórum jó legyen.

Arról van szó, hogy világszerte x darab ember ír olyan szoftvereket, amiknek egyszerre kell minden nyelven működniük (csak a legtriviálisabbakat említve: KDE és Gnome), és ők rájöttek (meg még sokan mások is), hogy az nem működőképes, hogy minden egyes nyelvhez másmilyen rendszerbeállítások kelljenek, ne lehessen egyetlen szövegszerkesztőben megadni egy alkalmazás nevét minden nyelven, meg ilyesmik, és számukra csak az UTF8 bizonyult életképes megoldásnak.

És miután ők elkezdtek UTF8-at használni a magyar szövegekre is, mivel az UTF8 minden nyelvre jó volt nekik, ezért a disztribben is egyre több magyar szöveg UTF8-as volt, például az összes .desktop fájl a /usr/{lib,share}/applications alatt. Ezeket pedig már Latin2-es disztrib alól volt kényelmetlen szerkeszteni, totális volt a kavarás. Sokkal tisztább ügy, ha átváltunk mindenütt UTF8-ra, és ezáltal az aktuális nyelvtől függetlenül mindenütt mindig támogatjuk az összes nyelv összes karakterét.

Na, ez volt a történet zanzásított változata :-)

:-)

Jah, ertem en, hogy mirol van szo, sot meg is ertem, sot en is orulnek, ha nem lenne ezer fele megoldas.

En megertem azokat is akik UTF-ezni akarnak, meg azokat is, akik nem betu fetisisztak :-)

> Tutod a világ meg volt eddig is UTF8 nélkül.. érdekes modon még müködött
> is. Ha valaki hozzászokott és biztosan kezeli az osdi, elavult ISO-s
> rendszerét,

Kb. ugyanezt mondták akkor, amikor az ékezet nélküli írásról áttértek az
ISO-s kódolásra ....

--
--- Friczy ---
'Death is not a bug, it's a feature'

ez mondjuk rossz pelda, mert
usepackage[latin2]{inputenc}
es minden jo

Én részemrol örülök és úgy gondolom ahogy az UHU-jék. Elég régóta húzódó probléma volt ez és ahogy látjuk még mindig húzódik. Az is helyes, hogy mást nem tamogatnak, mert fölösleges és csak tovább odázza a dolgokat. Tudomásul kell venni, hogy néha vannak kellemetlenségek, de nem toporoghatunk egyhelyben.

Dehogynem a filenévben lehet ékezet, nem koszlott Windowson vagyunk! :))) Tudom, hogy ott ez milyen probléma volt, angol NT szerverre nem lehetett magyar NT4 klienssel ékezetes filenevekkel írni, mert később nem találta meg és menteni sem tudta.

De itt Linuxról beszélünk és mint írtam, nekem 1994-95-96-97 (mittomén, lényegtelen, legalább 7-8 éve) vannak ékezetes filenevek a home-omban itthon. Semmi problémám nem volt velük soha. :)

Semmi bajom az UHU-val, ti. nem ismerem, soha nem használtam. Anno az UHU-tól teljesen függetlenül a GNOME-ot anyáztam, Egmont meg amiatt kezdett piszkálni.

Egyetértek. Hajrá UHUTF :)
Akinek nem tetszik, nem használja. Pont.

mókás, hogy ekkora vita kerekedett ki ebből is, holott az utf8-nak teljesen alapnak kellene lennie. szerintem _esetleg_ el kellene fogadni, hogy erre tart a világ (illetve már régen erre tart, de ez mellékes) és hogy ahelyett, hogy egy adott kódlapot támogatnánk mint régen, az utf8-at támogatnánk és így mindenki boldog lenne (kivéve a japánokat).
miért gond az, hogy xy a nevét rendesen szeretné írni? (ékezetekkel, speciális karakterekkel) miért nem egyértelmű a szükség, amikor mindannyian találkoztatok már olyan "credits" oldallal, amelyen több, különböző nemzetiségű ember neve volt látható és a spanyol tildés "n" és a magyar hosszú "ő" nem fért meg egymás mellett, emiatt csak egy halom gány látszott? vagy pont mi, a latin2-es neveinkkel szopjunk egy jót mert pedró és lars még befértek a latin1-be, de mi már nem? komolyan nem értem ez miért nem egyértelmű.
hogy ha erre most valaki azt mondja, hogy "na ja, credits", akkor azt mondom C headerek. vagy oda már ne írjuk be a neveinket ékezettel? miért kellene mindannyiunknak az angoloknak (vagy a latin1-nek, azaz nyugat-európának) megfelelően írnunk?

persze egyetértésre ebben a témában nincs sok esély, mindenki máshoz van szokva és más szempontokat tekint előnyösnek, de szerintem a jó rendszer az, amelyben mindenki támogatva van és nem kell átírnom a komplett programomat csak azért, mert pl holnaptól már nem csak magyarországon használják hanem izlandon is.

ennek örömére most megyek és megnézem hogy tökömbe kell ezt a $%^@#$@& utf8-at lekezelni C-ben :D

Nem tom, én Ubuntut használok full UTF-8 minden mindenhol, és soha semmi gondom nincs. Ha idáig eljut az UHU, még a végén áttérek... ;-) (vicc volt)

Már alig várom, hogy mikor jönnek az ékezetes változónevek a programozásban pl:

$átmeneti_érték = 0;

Muhahahah :-DD

Miért? Tök jó lenne:)

Java-ban megteheted már a kezdetek óta, mivel az natívan utf8. :))
(Egyébként meg egyetértek az UHUsok lépésével )

csunya-gonosz windozba':

private static readonly object árvíztűrő = new object();
public static int Tükörfúrógép()
{
lock (árvíztűrő)
{
return űber++;
}
}

A most frissen megjelent 390-es bétában már lehet, de ékezetekre csak case sensitive módon.

Kérem tisztelettel, akkor összegezném az eddig felmerülteket, vagyis summázatát adnám a szálnak:

Aki nem ért egyet, az köcsög.

Nemdebár ;)

Azt hiszem, mindannyian köszönettel tartozunk neked, aki megmutatta,
hogy milyen a nem nagyképű, nem magas lóról előadott szakmai hozzászólás
:P

--
--- Friczy ---
'Death is not a bug, it's a feature'