UHU-Linux UTF-8 tesztkiadás

Jol mondja kollega ur! Azok az atkozott ekezetek keseritik meg az egyszeri arvizturofurogepet vasarlo luzer eletet ;)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Miért kivéve a japánokat? Tudtommal a japán írást is éppúgy támogatja az UTF-8, csak a japánok még sokkal jobban ragaszkodnak a régi saját EUC-JP kódolásukhoz és még kevésbé akarják elfogadni hogy idővel váltani kell. A sztori persze a lényegét tekintve ugyanaz mint nálunk.

Vagy volna valami, amiben az UTF-8 tényleg rosszabb számukra?

0 szavazat

A hozzászóláshoz be kell jelentkezni

A japánoknak, kínaiaknak és koreaiaknak azért szívás az UTF-8, mert a jó
kis két bájtos karaktereik helyett 3 és 4 bájtos minden UTF-8 szekvecia.
Duplára nő minden fájl mérete.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nem az kÃ¶csÃ¶g, aki nem ért egyet, hanem az, aki nyilvánvalóan úgy hangoztatja saját véleményét, hogy közben meg sem próbálja megérteni a másik fél másmilyen igényeit, másmilyen szempontjait, másmilyen érveit stb... szóval aki nulla nyitottsággal a végsőkig kiáll az általa megszokott rendszer tökéletessége mellett. Vagy csak azért beszól, mert az neki jól esik, vagy mert menő dolog az UHU-t szapulni, tök mindegy hogy mit csinálnak.

Egyébként ha valakinek még mindig nem volna világos netalántán: amikor arról van szó, hogy UTF-8-ra átállunk, akkor a tartalmat, valamint a tartalom megjelenítéséért felelős kódokat _egyaránt_ átállítjuk, pontosan azért, hogy minden ékezet (ne csak a magyarok) helyesen látszódjanak, vagyis míg a hivatalos UHU 1.2-ben sajnos még többször találkozni olyasmi krixkraxokkal, mint amiket Aewyn poénból írt, addig a mostani tesztkiadásban már (lényegében) sehol sem, a betűk mindenütt pontosan úgy jelennek meg, pontosan olyan ékezettel (és még picit sem másmilyennel), ahogyan meg kell jelenniük. Erről van szó. Ki lehet próbálni, és aki kipróbálta, nem csak látatlanban él feltételezésekkel, attól szívesen vesszük az észrevételeket (jókat, rosszakat egyaránt) a továbbiakban is.

Félreértés ne essék, nem Aewyn ellen akarnék szólni, az ő írását poénnak tekintem mert szerintem pusztán annak szánta, csak tökéletes alkalom adódott, hogy még egyszer, remélhetőleg utoljára összefoglaljam, hogy miről is van szó.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Aha, értem. Mondjuk figyelembe véve a technikai fejlődés mértékét, valahogy ezt a szempontot nem tudom komolyan venni. Nyilván csak a szövegfájlok mérete nő szűk duplájára (azért a cjk karakterek túlnyomó többsége csak 3 byte az UTF-8-ban, tehát a másfeles szorzó tűnik reálisnak), a képek, videók, programok stb. mérete változatlan marad. Tehát nagy átlagban lehet mondjuk úgy 1.05 alatti méret-szorzóra számítani szerintem. Na jó, talán spéci szöveges gigantikus méretű adatbázisok esetén 1.5 körülire. Namost ha megnézzük, hogy mennyi időnként nő az átlag sávszélesség, az átlag tárolókapacitás, átlag prociteljesítmény (a szövegek feldolgozására) stb. újra meg újra az ennyiszeresére, akkor jót fogunk röhögni, figyelembe véve hogy a karakterkészlet kapcsán egyszeri, nem ismétlődő átállásról van szó. Magyarán szólva: szerintem elhanyagolható a méretnövekedés, nem érdemes vele foglalkozni, ha cserébe a többnyelvűség korrekt támogatása és bármiféle szoftver nemzetközi piacon jobban eladhatósága áll a mérleg túloldalán.

Nade legalább már tudom, hogy miért duzzognak. :-)

0 szavazat

A hozzászóláshoz be kell jelentkezni

nem utf16? nekem úgy dereng.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Jaja... egyetértek.. A kérdés: a japánokkal mi a baj?

Úgy látom hogy hiragana-t és katakana-t lehet írni... talán a kanji nem megy?

Egyébként meg itt egy szemléletes példa, hogy miért is jó az utf8:

http://www.columbia.edu/kermit/utf8.html

0 szavazat

A hozzászóláshoz be kell jelentkezni

Bocsánat, demagóg voltam :(

Mindenesetre jó az utf-8, legalább lehet dobálni az adatokat különböző nyelvű rendszerek között, és mindenhol stimmelni fog. De ezt leírták mások is, én csak megkövetem magam...

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ezen az oldalon kanji-k is vannak.

0 szavazat

A hozzászóláshoz be kell jelentkezni

latin2-ben nincs francia kalapos u betű. Persze jó a latin2 inputenc, ha jó neked hogy ezt a betűt escape-elve rakod a tex fájlba, ami kódolás semmilyen más rendszerrel nem kompatibilis, a fájl szerkesztése során sem ezt látod, nem tudod copy-paste-elni html, sima txt, vagy ilyesmi formátumok között. De ha valaki az egyszerűbb utat akarja járni és kalapos u-t látni mindenütt, a tex fájl szerkesztése közben is, és vele párhuzamosan magyar ű-t is használni, akkor neki a ma létező karakterkészletek közül csak valami unicode alapú (leginkább az utf8) lesz jó.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A java változó nevek bármilyen unicode karaktert tartalmazhatnak. Maga a forrás file többnyire a platform encodingjában van tárolva, de ez nem kötelező. A forditónak meg lehet adni a kezdetek óta, hogy milyen encodingot használva próbálja meg értelmezni a dolgokat. Természetesen, ha ISO-8859-1-ben mentjük el a forrás fájlt, akkor nehezen fogunk tudni mondjuk egy kinai karaktert tartalmazó változóra hivatkozni :)

Maga a leforditott class fileba viszont minden string UTF8-ként kerül tárolásra.

0 szavazat

A hozzászóláshoz be kell jelentkezni

egmont még a végén szívinfarktust kapsz és UTF8-as sírköved lesz :)

Az UHU halajdon előre a kijelölt úton a többiek is úgyis erre fognak lépni. A tisztán amerikai meg mini disztrók úgyis maradnak a régi hagyományosnál egy darabig.

0 szavazat

A hozzászóláshoz be kell jelentkezni

> Sajnos (UHU-s) fanatikusokkal elég nehéz értelmesen
> beszélni.. hugyagyuak.

Kene slrn-be egy olyan feature h be tudjam jelolni hogy ki az
aki a hulyesegevel mar regebben elasta magat nalam.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez az egész UTF8 megérne egy misét.. kicsit túl van lihegve.:)

Nem tudom ki hogy van vele, de szerintem a többség, aki konzolon is használja a rendszert, általában ki szokta kapcsolni az utf8 kodolást (ha azzal települ a rendszer) és átállítja ISO-8859-X-re.

Jó nagyokat lehet szivni az UTF8-as confog fájlokkal.

A kevés kivételtől eltekintve véleményem szerint a baromság netovábbja a "midnenhol UTF8" elképzelés..

Fri

0 szavazat

A hozzászóláshoz be kell jelentkezni

unset LANG

A legidegesitobb, amikor a vim on-the-fly konvertalja a fajlt utf-8 -ba (ami eredetileg sima szoveges fajl volt), igy mysql .sql fajljait remalom nezni.

Raadasul szerkeszteni is. Mivel a kepernyon ilyen 2 ekezetes betu van egymas mellett, mintha utf-8 lenne.

Nem is ertem miert nem lehet ugy csinalni, hogy egy fajlban ha utf8 karakterek kozott sima latin2 karakter van, akkor annak a hatterszine mondjuk piros, de attol meg jol jelenne meg.

0 szavazat

A hozzászóláshoz be kell jelentkezni

jó. akkor dögöljön meg minden magyar, cseh, lengyel, maláj, kínai, japán, stb., aki nem a korlátozott angol karakterkészletet akarja használni?

értem, hogy mit mondasz, de az hosszú távon nem a legjárhatóbb út. szvsz

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az alábbi címen:

http://www.cs.bme.hu/~egmont/utf8/ [www.cs.bme.hu]

találsz egy leírást, a 0., 1. és 2. fejezet az érdekes csak belőle, ahol igencsak részletesen kifejtem, hogy miért van szükség mindenütt az UTF-8 használatára, és mik a teljességgel megoldható problémák az ISO-8859-X karakterkészletekkel.

Örülnék, ha te is konkrétumokat írnál, vagy általam írt konkrétumokat cáfolnál meg általános életérzés helyett.

Egyébként érzésedet az is alátámaszthatja, hogy technikailag még akad tennivaló az UTF-8 helyes támogatása terén, nekünk is több alapvető utilityt és még a kernelt is meg kellett patchelnünk, és emiatt nem igazán látom, hogy tudná egy disztrib egyszerre támogatni a 8859-eket és az UTF-8-at is. Éppen ezért mi váltottunk, mostantól csak UTF-8.

Szóval két külön kérdés, hogy elvileg az UTF-8 mennyire jó, és hogy gyakorlatilag amit egyik-másik disztrib nyújt UTF-8 címszó alatt, az mennyire használható.

Ha van időd, próbáld ki az új UHU-t, és meglátod, ha mit sem tudsz arról hogy mi az a 8859-2 és UTF-8, egyszerűen csak használni kezded a rendszert és irogatsz ékezetes betűket, szinte semmi különbséget nem fogsz észrevenni, például a szöveges Linux konzolon látszólag teljesen ugyanúgy működnek továbbra is a magyar ékezetek, mint eddig (noha a háttérben teljesen más történik, de látszólag ugyanaz: leütsz egy ékezetes betűt, az megjelenik, pont mint egy ékezet nélküli).

0 szavazat

A hozzászóláshoz be kell jelentkezni

hülye vagyok, na

szóval:

... mik a teljességgel _megoldhatatlan_ problémák az ISO-8859-X karakterkészletekkel ...

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha egy fájlban kétféle kódolás váltakozik (utf8 és latin2), akkor már régesrég rossz valami abban a rendszerben, amit használni akarsz. Egyébként feature-javaslatoddal ajánlom, keresd meg a vim fejlesztőjét!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Azt értem, hogy meg kellet heggeszteni a kernelt meg egy csomó mindent. Azt meglehet oldani esetleg duál Bootal, hogy UTF-( vagy elavult karakterkészletet válaszon az ember?

Nekem pillanatnyilag úgy van megoldva Wine segitségével Windowsos Akrobatreader fent figyel és ami elavult azt azzal nyitom meg.

Nem tul elegáns viszont müködő megoldás.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Semmi nem akadályoz meg benne, hogy két külön partícióra telepíts egy 1.2-t és egy 1.2-UTF8-at, amik semmit sem tudnak egymásról. Értelmét viszont nem látom.

Ha csak egy-egy ősrégi elkefélt alkalmazás kedvéért kell Latin2-es környezet, az megoldható simán az új UHU alatt is, sőt, van is pár program, amelyik automatikusan ilyen wrapperen keresztül indul, mivel az új LANG=hu_HU.UTF-8 környezeti változóval nem működik helyesen, tehát itt elrejtjük azt, hogy valójában ez a néhány program Latin2-es lelkivilágú.

Hasonlóan Latin2 kódolást használó fájlok szerkesztésére is több progi is képes.

Szóval egy-egy pillanatra Latin2-be visszakapcsolni egy-egy progi futtatása vagy fájl szerkesztése erejéig nem probléma az új UHU-val. Ugyanakkor a komplett disztribet nem tudod Latin2-re visszakapcsolni (illetve tudod csak csomó minden rossz lesz), hiszen a konfig fájlok kommentjeit, manpage-eket, csomagjaink leírását és rakat ilyesmi dolgot alakítottunk át UTF8-ra, amit ha Latin2 környezetben akarsz megjeleníteni, akkor jön az ékezetes betű helyett két karakternyi olvashatatlan borzalom, aminek pont az elkerülése a cél.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Szia Egmont!

Én ugyan csak olvasója vagyok a hup.hu-nak és szinte sohasem szólok hozzá a témákhoz, hiszen engem csak a hírek és az emberek véleménye érdekel. Most viszont úhy érzem, hogy szólnom kell.

1. gratulálok az UTF8-as kódolás bevezetéséhez, de hibáztok. Magam is hosszú-hosszú ideje vagyok rendszergazda és az UTF8-nak NEM JÖTT EL AZ IDEJE!

2. Hivatkozol a SuSE disztibre, hogy ők már átálltak. Szinte az összes, általam adminolt szerver különféle SuSE disztibeket futtat 7.3-9.3 bezárólag. A SuSE megoldotta, hogy vissza tudjak állni UTF8-ról és ha visszaállok úgy is MŰKÖDIK! Gondolom ez a tény elkerülte a figyelmedet.

3. a hangvételed nem igazán kelti egy határozott SZAKEMBER benyomását. Úgy beszélsz az emberekkel, mint a kutyákkal, folyik a szádból a trágyalé, akkora paraszt vagy.

4. Ebből ered, hogy az életben nem fogom használni az UHU-t! Hogyan kaphatok normális supportot, ha csak egy fórumban így beszél a cég képviselője velem/az emberekkel? ( a SuSE ebben nagyon ott van.... ).

5. Volt annak idején egy projektunk, amiből azért DOBTUK KI AZ UHU-t, mert olyan nagyképű supportot kaptunk, olyan szakmai felkészületlenséget tapasztaltunk, ami számunkra nem volt megengedhető, viszont a SuSE képes volt segíteni. ( Funny, nem? )

6. Én eddig támogattam a magyar szoftvereket, de az UHU most az első olyan, akit én BOZTOSAN nem fogok támogatni és ajánlani sem.

Szerintem, öreg, szállj le a magas lóról és töröld meg a nózikádat és próbáld meg a SZAKMÁBAN dolgozó emberek véleményét elfogadni; amivel nem kell egyet is értened. Sajnos az olyan bunkók, mint te rontják el e szakma hírét, magad rontod el a saját és a disztibed imázsát. Szerintem.

Borzasztóan sajnálom, hogy pont egy viszonylag jó, magyar terméket tesztek tönkre a beképzeltségetekkel és nagyképűségetekkel. Eddig bármilyen külföldi szoftverkészítő cégnek írtam support ügyben, ha nem is tudott segíteni DE udvarias volt. Szedd össze magad ember....

Üdv,

Johnny

0 szavazat

A hozzászóláshoz be kell jelentkezni

Beleolvatam a doksidba, de engem nem gyözött meg..

Pontosabban arról, hogy két malomban örölünk..

Az "ézéssel" kicsit melléfogtál", ugyanis nem érzés, hanem programozási, rendszergazdai tapasztalat.. és rosszak, ezért nem igazán tudsz meggyőzni.

Konkrétumok:

- szerkessz egy shell scriptet UTF8-ban (szép magyar magyarázatokkal, kiirásokkal) és add oda valakinek.. ha ISO-s a rendszere, csuklani fogsz, de rendesen.

- a konzolok, parancsok nyelve "angol" orientált..

- nagyon kevés olyan ember van, aki szüksége van arra, hogy konzolban a beszélt nyelvén kivül kinaiúl, csehül vagy egyéb nyelven is irjon egy "doksiban".

Arra ott vannak a GUI-s szerkesztök. Ha meg valaki akar, hát olyan editor-t választ ami tud UTF-at.

.. és folytathatnám.

Mielőtt az észt osztod, hogy mit probáljak ki.. probáldj ki Te egy UTF-es rendszert, amiről 5-10 másik rendszert felügyelsz, amik nem UTF8-asok.

Én egyszer "kiprobáltam".. rémállom.

Mielőtt.. tisztában vagyok vele, hogy á tlehet álligatni a konzolt, hogy ne legyen probléma..

Fri

0 szavazat

A hozzászóláshoz be kell jelentkezni