Ezt nem igazán értem...

Sziasztok!

Szeretném, ha valaki megmagyarázná az alábbi jelenséget:

Win XP (csak XP)
Megnyitod a Notepad-ot
Beírod szó szerint a következő szöveget: Bush hid the facts
Elmented bárhova, bármilyen néven, de txt legyen a kiterjesztés
Becsukod a Notepad-ot
Megnyitod a .txt fájlt Notepaddel...
A link hozzá:

http://www.jokeroo.com/extremevideos/notepad_hidden_text.html

Hozzászólások

hááát ez de durva. mindent el tudtam képzelni erről a mocskos bandáról. ezt is...
szerintem billigeci és a paraszt bush amúgy is puszipajtások...

Szerintem egyszerű. Unicode -ként menti el, de megnyitáskor nem úgy nyitja meg. Nincs itt semmi ördöngősség, csak hülye programozók :)

Nem az egyetlen bug a Notepadban. Még egy tök szimpla texteditort se bírtak normálisan összekalapálni.

Mert természetesen neked rendelkezésedre áll olyan módszer, amivel egy fájlról meg lehet mondani biztosan, hogy milyen karakterkódolást használ. :)

Ettől még a fentinek bugszaga van erősen, meg vicces az eredmény, de azért ne csináljunk már úgy, mintha az összes FOSS program mindig jól tippelné meg a kódolást, mer szépen beesek a szék alá, és még a teát is félrenyelem a röhögéstől.

A tervezési bug is bug. Hányféle karakterkódolás van egy (magyar) windowsban? Most így kapásból 3-at tudok felsorolni.

Visszatérve a Notepadra: ha pl történetesen tényleg unicode szöveget szerkesztesz vele, akkor meg szemetet rak az elejére.

Persze hogy az.

Kit érdekel a magyar win. Irreleváns. Legalábbis nagyon remélem, hogy az, mert ha nem, az biza elég nagy tervezési bugot jelentene.

Nem akarom én védeni a notepadot, mert egy nagy rakás szerencsétlenség az egész, de ettől még igaz marad az, hogy nem lehet fixen eldönteni egy fileról, hogy milyen kódolású karakterek vannak benne. És ez nem az MS hibája. Innentől kezdve hasalni vagy kénytelen. Persze lehetne ezt jobban tenni, meg egységesen ugyanazt gondolni, ha nem tudunk dönteni, vagy kérdezni, vagy ilyesmi, szóval valami jobb megoldást találni a problémára. Jogos. Csak az ellen tiltakozok, hogy ezt valami triviális hibának tüntessük fel, és egy ilyen miatt temessük a programot. (Más miatt nyugodtan :D)

nem lehet fixen eldönteni egy fileról, hogy milyen kódolású karakterek vannak benne

Már hogyne lehetne eldönteni. El is döntöm. Mentéskor. Innentől kezdve ez egy metaadat, és illene eltennie az információt valahova. Technikailag abszolút megoldható.
De mondjuk az is elég lenne (egy csúnya) megoldásnak, ha egy listából én is kiválaszthatnám a kódolást betöltés után.

Ez felveti a kérdést, hogy miért nem lehet magic byteokat használni utf jelzésére? Vagyis szerintem a notepad az első 3 karaktert ezért rakja bele... Előre az unicode 2.0-ért! :)
Ja és tudom, hogy most csúnyát mondok, de ha átvennék az unicode progik a notepad által használt első 3 karaktert, akkor soha többé nem lenne kérdés, hogy az adott file unicode-e, vagy valami más. Az egyetlen probléma az unicodeos progik mennyisége...

A magic byte elég szívás. Ha nekiállsz használni, akkor az olyan triviális alapvető dolgok is jóval bonyolultabbak lesznek, mint két szövegfájl összefűzése, vagy szövegfájl részletének kivágása (például grep, tail stb., hogy elkanyarodjak a windowsos vonaltól). Merthogy mondjuk ha utf8 fájlból grepelsz, akkor az eredmény is utf8 lesz, amit beleirányíthatsz egy fájlba, tehát a grep-nek a BOM-mal kéne kezdenie az outputot. A tail-nek is oda kéne tennie az output elejére, jóllehet, ekkor már nem az input fájl utolsó x byte-ja lesz az output. Stb... Lehet hogy megoldanánk egy problémát, de behoznánk helyette egy másikat. Inkább azt kéne elérni, hogy meta-adatok hordozása nélkül is az legyen a természetes default, hogy UTF-8-at használunk. Ha nem érvényes UTF-8 egy beolvasandó fájl, akkor lehet tippelni egyebekre...

>> Ez felveti a kérdést, hogy miért nem lehet magic byteokat használni utf jelzésére?
szerintem a byte order markra gondolsz, ami - a nevének megfelelően - a little/bigendian bytesorrendet hivatott jelezni (hogy utf-8 esetén - ahol ez nem probléma - miért használja a notepad, arra nem tudok választ adni)

Ja, hogy ugy. Ez mar filozofia :) definicio kerdese, hogy mit tekintunk a fajl reszenek. En ugy ertelmeztem, hogy a fajl resze csak a fajl szorosan vett tartalma. A tobbi (mint fent is mondtak) fajlrendszerfuggo. Atnevezheted, toucholhatod, a tobbi dolog az en nezetem szerint nem tartozik a fajlhoz, csak a fajlrendszer beli cimet, elerhetoseget hatarozza meg. Mint ahogy a lakasod tartalma a butor, de a lakcimed nem.

Ha egy őbenne létrehozott új fájlt az általa felkínált default módon elmentve utána az általa felkínált default módon nem tud megnyitni, akkor az bug. Tudom hogy van rakat karakterkészlet, és nem lehet atombiztosan megtippelni, de az azért elvárható lenne, hogy abban a kódolásban ment, amit utána megnyitáskor elsőként kipróbál.

van magyar vonatkozasa is:
szad ele kis .....
:)
/* bocs az esetleges helyesirasi hidakert */

Én azt nem igazán értem, hogy hogyan lehet egy topiknak ilyen rossz címet választani. Teljesen semmitmondó.

--
trey @ gépház

Hehe. :D

Kipróbáltam a wine notepadját, azzal nincs ilyen ficsőr. :)
_______________________
"Két dolog végtelen: az emberi butaság és a világegyetem, de az utóbbiban nem vagyok biztos." A.E.

Az én mozillám is belepusztult a megadott link-be...

Ezt én ismerem, csak nem ezzel a szöveggel. prog/pcforumon volt róla szó. De a magyarázatot nem tudták asszem... :)

Valamelyik Word verzió lefagyott, ha a azt írtad be: "Apámék"
asszem az "Anyámék"-ra i slefagyott. De nem úgy hogy csak lefagyogatott, hanem reset_gomb szinteen.

Azt ezek akarnak a Holdra menni.

> Sol omnibus lucet.

Ezek után mondja valaki, hogy a fájlrendszerbe pakolható metainformációnak nincs értelme... Ha egy nyamvadt Content-Type/Encoding-ot le lehetne rakni, már segítene.