Hogyan működött régebben e-mailezés UTF-8 előtt?

sziasztok,

pár dolog nem világos a számomra... a kilencvenes években nagyon sok probléma adódott az ékezetes betűkből. Elküldtem egy e-mailt egy másik címre (amely másik domain-ban volt), és nagy volt az esély rá, hogy hibásan jelennek meg az ékezetes betűk. Ha az én domain-om mondjuk latin2 kódolást használt, és elküldtem az e-mailt egy olyan domainra, amelyik másik kódolást használt, akkor melyik szerver alakította át az üzenetet? Vagy a túldoldali szerver megkapta, hogy az én üznetem latin2 kódolású, és akkor az üzenet megjelenítésénél átváltottak ők is latin2 módba? Vagy átalakították a saját kódkészletükbe, és úgy jelenítették meg az üzenetet?

Hogy lehetett például orosz-magyar szótát készíteni anno? A latin2-ben nincsenek benne az orosz karakterek, az oroszban, meg gondolom nincs 'ő' és 'ű'?

köszi

Hozzászólások

Szia!

Semmilyen átalakítás nem volt, és tudtommal most sincs (valaki javítson ki ha tévedek). Az karakter kódolás meg van adva az e-mail fejlécében (jobb esetben), és az alapján kellene tudnia a kliensnek, hogyan jelenítse meg.

"A regi szep idok" ;)

Én személy szerint úttörőként kezdtem (linux alatt is) ékezeteket használni mindenhol (igen, még egy fapados terminálban is). Ez akkoriban a szakmán belül igen nagy tabu volt, és mindenki hülyének nézett, hogy magyar a default billentyű kiosztásom is, és a levelekben is ékezeteket használok.

A probléma anno egyébként az volt, hogy a legtöbb (levelező) program nem jelölte meg megfelelően hogy a levél milyen karakter kódolással íródott, így a címzett kliensén múlt, hogy azt miként próbálja dekódolni. (sőt, a fejlécben lévő mezők kódolása a mai napig nem egységes! az ékezetes domainek megoldásáról meg ne is beszéljük.)

Sikeres dekodólás után még a karakter készletekkel is meg kellett birkózni, mert ha a címzettnél nem voltak telepítve megfelelő betűtípusok, akkor hiába a megfelelő kódolás, mégis hiányzó ékezeteket karaktereket látott...

Egyébként még ma is sok betűtípus van mi csak ASCII karaktereket tartalmaz, és olyan fostalicska program is, ami nem ismeri az UTF-8 kódolást.

--
zrubi.hu

A legelső megoldás a repu:lo"e'kezet volt. Rengeteg szoftvernél a 7 bites kódtábla után nem volt élet.
Aztán pedig jött a (hogyan hívják?) =a1 --> 0xa1 á betűre. Tehát egyenlőség jel és a hexa kód. Viszont nem volt megadva vagy figyelembe véve a levél fejlécében, hogy milyen karakterkódolással érted a 0xa1-et.

Ma már benne van a fejlécben a karakterkódolás és a legtöbb levelezőkliens figyelembe veszi.
Sajnos az egységes UTF8-ra még mindig nem sikerült átállni.

@zsigabiga
@zrubi
@hg2ecz

kösz a hozzászólásokat... de mi van akkor, ha egy e-mailt én webes felületen olvastam, amely tételezzük fel, hogy latin2 kódolású... kapok egy levelet, amely latin1 kódolású és azt kell egy latin2-es környezetben megjelenítenem.. ekkor mi történt? Gondolom a weboldal nem kapcsolt át latin1-be az e-mail kedvéért.

"a kilencvenes években nagyon sok probléma adódott az ékezetes betűkből. Elküldtem egy e-mail"

Ekkor még nem volt probléma a webes levelező. Volt terminálból
- elm
- mutt
- pine
- ...

Aztán lassan megjelentek a bináris asztali kliensek, amik pop3 hozzáféréssel vették át a levelet.
A webes levél megjelenítés témája inkább ezredforduló környéki volt.

Egyébként a megoldás a HTML-be berakható &#decimális szám; formában berakható unicode karakter volt.
Ma is az „akármi” (& #8222;akármi& #8221;) kifejezést gyakoran használjuk a magyar idézőjelezésre az "akármi" angol helyett. Ugyanígy beszúrható a cirill karakter is bármely HTML ékezetkódolás esetén és mindig unicode értékként.

Cirill karakterek unikód szerinti hexa értékei: http://en.wikipedia.org/wiki/Cyrillic_script_in_Unicode

A kérdés csak annyi volt, hogy az adott oprendszerben volt-e egyáltalán font rá, vagy üres négyzeteket jelenített meg?

Akkor még nem nagyon volt webes kliens, de ezesetben is a kliensen múlik, és ilyenkor a kliens maga a web alkalmazás. Ezt neki kell tudni megoldani, de ő is csak a levelekben lehelyezett kódolási információból tudott volna (ha a küldö kliense belerakta volna) dolgozni.

webes kliens esetén még maga a weboldal is meg kell(ene) hogy adja hogy a html végeredmény milyen kóolású - ezt még ma sem mindenhol csinálják meg rendesen - így a böngésző maga is 'elronthatja' az végeredményt. (azaz a default beállítást használja egyéb infó hiányában)

Tehát az eredeti levél kódolása, és a webmail oldal kódolása eltérhet egymástól, nem ez az alapvető probléma, hanem a levélben lévő hibás vagy hiányzó kódolási információ.

--
zrubi.hu

Szép emlékezetes szívás volt vele. Akik fentebb írtak már leírták.
Azért ma sem fenékig tejfel. Ha sok levelet idézgetnek különböző kódolásokkal ma is hajlamosak a levelezőprogramok eltévedni.

nem volt vele semmi gond, mert általában nem facebookszökevény funkcionális analfabéta fogyatékosok voltak a levelezőpartnerek, mint ma

Azt hiszem öreg vagyok, hogy azon csodálkozom, ilyen topicok feljönnek :D

A domain-ek (netwörkök) közötti átvitelt szépen leírja az rfc822. (készült 1982-ben) Az egyes hálózatok és hostok közti átvitelt is specifikálja. Bár volt azért szívás.

Az áttörést az rfc2045, a MIME hozta 1996-ban.

Az "orosz-magyar szótát" :) ennél sokkal precízebben NEM emailben készítették. :)
Viszont a Moszkvából Budapestre érkező telex vagy távirat jóval az email előtt is működött. Ilyenkor egyezményes átírást alkalmaztak, amely angol karakterkészlettel fonetikusan jelenítette meg a szöveget. Moszkvában még nem jártam...