van az utf8-ban egy "G"-re elegge hasonlito "ɢ" karakter. Ezzel a specialis karaterrel regisztralt be valaki egy domaint, ami atiranyit valami furcsa oldalra. (nem az oldal tartalma a lenyeg)
Egy fokkal erdekesebb lenne, ha pl. atiranyitas nelkul egy google bejelentkezesi kepernyonek latszo oldal jonne be....
Vajon az emberek meg tudnak kulonboztetni az Оtp.hu, ⵔtp.hu, Otp.hu, Οtp.hu az Otp.hu-tol ? (mindegyik beirt domain masik, O-nak latszo utf8 karaktert hasznal)
Hát nem tudom... Mondjuk az eredetire megszólalásig hasonlító oldalon, az eszköztáron a nagy piros karikával áthúzott „S” betű hatására lehet elgondolkodnék milyen oldalon is vagyok valójában. Ha csak nem a FlagFox által mutatott, a megszokottól eltérő mintázatú zászló nem szúrja ki előbb a szemem.
Mondjuk lehet azoknak kéne áttanulmányozniuk, akik csinálják, és nem csinálni olyan furcsaságokat miszerint
Szerk: A fórummotor elnyelte a bejegyzésem végét, vélhetően mert mindenféle spéci unicode karaktereket raktam bele, és a mysql sajnos bénán kezeli (utf8 != utf8mb4). Mindenesetre itt a bejegyzésem: http://pastebin.com/raw/Y0w04VfY
Karakterek összevonására: ezt pont magyar nyelvűként értékelhetnéd (cs,dz,dzs,gy,sz,ty)... persze a nagy része nincs benne az Unicodeban és az Unicode Consortium hivatalos álláspontja, hogy soha nem is lesz, mert az összes meglévő doksit át kéne kódolni az egyértelmű használatukhoz, úgyhogy inkább kódold át az összes doksidat és tegyél az összetartozó karakterek közé egy null-szélességű, összetartozást jelölő karaktert (és tényleg ez az érvelésük és a kínált megoldásuk)
Emoji: szintén az alma szabadította ránk azt a rettenetet, amikor be akart törni a Japán piacra, ahol a rengeteg gyártónak a szabad karakter-helyeken voltak gyártóspecifikus képei/ikonjai. Aztán az apple tett a nem-japán iphoneokba is egy emoji billentyűzetet, az eredményét meg lehet látni :( [de legalább már van skin tone modifier, úgyhogy vigyoroghatsz bármilyen bőrszínnel, szóval nemzetközi...]
De hogy már lassan minden szarnak lesz egy emoji változata...
Az speciel már a Unicode 6.0-ban is volt (az első változat emoji támogatással) :( [vajon a szar ikonra is működik a szín modifier?]
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
Nem a magyar az egyetlen nyelv, amelyik 2 v. több egymás mellé kerülő latin betűnek az elemektől eltérő kiejtést társít, de nem tudok másikról (ez nem jelent semmit), ahol az ebből eredő problémák ellenére (házsor < házsártos) ragaszkodnának ahhoz, hogy ezek a betűtalálkozások újabb betűket érjenek, amelyeknek rendezéskor saját értékük van.
Pedig senki sem tart pisztoly a fejünkhöz, hogy ezt tegyük, és az "így alakult ki" sem lehet érv, hiszen az MTA n+1-edik onanizálásának kimenete rendre az, hogy tesznek rá, hogy mi hogyan alakult ki.
" amelyik 2 v. több egymás mellé kerülő latin betűnek az elemektől eltérő kiejtést társít"
Nem erről van szó. A cs, dz, dzs és társai nem több betűk egymás mellett. Az egy darab betű a magyar ábécében. Csak éppen két latin ábécés karakterképpel/írásjeggyel tudjuk leírni. De attól még a gy is egy külön eleme a magyar ábécének (azaz betű), nem g + y egymás mellett.
És épp ezért lehet megoldani a házsártos/házsor problémát úgy, hogy amikor az elsőt akarod írni, más Unicode karaktert használsz (ami a zs betűt kódolja, mégha a képe olyan, MINTHA egy z és egy s lenne egymás mellett), amikor a másodikat írod, akkor két Unicode karaktert használsz. És akkor a gép számára (pl. helyesírásellenőrzőnek) egyértelmű lesz, hogy milyen betű van ott - és tudni fogja, hogy nem is lehet ház-sártosként elválasztani stb.
Azért egy betű a cs, és nem cé-es, mert mi azt mondjuk, hogy az legyen. Pedig erre semmi okunk. Ahogy a svéd se vezeti magát a falnak azzal, hogy azt mondja, hogy "mivel az ng meg az skj saját hangot jelöl, az ng meg az skj EGY betű", hanem aszondja, hogy a hang az hang, a betű meg betű; az ng két betű, aminek történetesen egy se-n-se-g hangalakja van.
Nincs rá oka, hogy máshogy fogja fel, mert semmit sem nyerne a réven csak veszítene a vámon.
A magyar nyelv ilyen egyszerűsítések után is informatikai kihívás volna, de momentán rémálom.
De, van rá okunk. Ez a magyar ábécé. Amikor áttértünk a rovásírásról (ahol a csének külön jele volt) a latin betűs írásra, probléma is volt, nem tudták, hogyan lehet a latin ábécével magyar betűket kódolni. Emiatt olyan a Halotti Beszéd illetve az ómagyar Mária-siralom, amilyen. Az egy tök magyar szöveg, csak nem tudták, hogyan lehet jól leírni latin betűkkel például azt a szót, amit ma már így írunk: gyümölcs. Mert akkor valahogy így írták: gimilcíctul . De azt írt: gyömölcsétől.
Épp ezért egy betű a csé a magyar nyelvben. Csak éppen két latin karakterrel kódoljuk, mert már latin ábécével (illetve annak egy variánsával) írunk, és nem rovással. Rovásban van is külön karaktere a csé betűnek.
Ne feledd: a nyelv nem ugyanaz, mint annak írása. A magyar nyelvben van csé betű. Ezt a magyar ábécében (ami latin betűs írás) cs-vel kódoljuk.
Azért egy betű a csé és nem cs, mert a csé egy külön betű. Amit írhatnánk úgy is akár, hogy č, ahogy a szlávok teszik. De mi cs-sel kódoljuk.
Én azért többé-kevésbé még mindig az MTA-t és az Unicode Consortiumot hibáztatom (eddig nem kerültek be a digraphjaink/trigraphunk, most már nem is fog), még ha mindkét felet meg is értem (az MTA szerintem csak nem foglalkozott ezzel, az UC viszont nagyon megszívná, ha egy nyelvnek megengedné, mert akkor mindenkinek kéne).
Egyébként az UC véleménye védhető is, a legtöbb digraph a használat szempontjából lényegtelen, mert nem tagjai az adott nyelv ABC-jének (de legalábbis vitatkoznak róla, pl. AFAIK a hollandok az IJ digraphjukról nem bírják eldönteni - de annak legalább van code pointja...). Szvsz. nálunk viszont pont azért, mert tagja az ABC-nek, _minden_ műveletben (rendezés, rövidítés [Csaba néven publikálni marha nagy szívás, mert mindenki rosszul fog rád hivatkozni az automatizációk miatt], elválasztás stb.) szerepe van, így megérdemelték volna azt a néhány a kódpontot.
És akkor már teljesen off: a legalja, amikor hosszasan szívsz azzal, hogy amennyire lehet, helyesen rendezd a dolgokat (hosszasan szívsz itt ugye annyi, lősz egy rendes collate-t :) ), aztán jön az ÜF, hogy miért vannak egyben az A és az Á betűvel kezdőd elemek a listában. Mert úgy helyes. De nem úgy helyes, előbb az A, aztán az Á. Magyar Helyesírási Szabálykönyv felcsap, megmutat. Jó, de ez így akkor se jó...
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
Teljesen érthető az ügyfél (még ha igaza de jure nincs is). A betűzés után a 2. dolog volt, amit megtanítottak neki, az aábécécsédé volt, és az még meg is maradt, már csak azért is, mert együtt újra át kellett darálni a gyerekkel. Nem úgy, mint a szótári rendezést, amit hatodikban (se) tanult meg, és azóta se tűnt fel (vagy szabálykövető, vagy nem) szótárak használatakor a turpisság.
Emellett még intuitívabb is VOLNA leszögezni, hogy ha egyszer van olyan, hogy Á, ami nem ugyanaz, mint az A, akkor tényleg ne legyen ugyanaz.
Rendre visszatérő önhízelgés, hogy "a magyar... az olyan mérnöki nyelv". Az, ha a dátumot és a családnév-keresztnév formát nézzük, máshol viszont üvölt, hogy bölcsészek (no offense) kalapálják.
- o -
Arra pedig tényleg kíváncsi volnék, hogy az UC Con. nem gondolt ilyenre, vagy gondolt, csak hangosabbak voltak azok az érvelők, akik aszonták, hogy "ugyan mi rossz is származhatna abból, ha két DN ránézésre (mármint ha ember - aki ilyen DN-eket általában használni szokott - ránéz) ugyanaz!?"
"Biztos jo otlet volt UTF8 domain neveket engedelyezni?"
Megcsinálhatták volna úgy is, hogy megfelelő tld esetén megfelelő karakterek engedélyezettek. Mi oka lenne valakinek cirill betűket rakni egy nemzetközi brand nevébe? Cserébe egy orosz/ukrán, stb oldal esetében (ami célszerűen adott ország tld-je alá tartozik) van értelme
Ezert kell figyelni a https pici ikonjat ott felul. Ne adj isten, ha csak klikk-el mentel valahova, akkor klatty ra es csekk, hogy ki a certificate issuer. De IMHO nincs olyan CA, amelyik alairna egy ilyen domain-t.
A masik meg az, hogy erzekeny oldalakra SOHA nem megyunk linkre klikk-el. Arra van az address bar history meg a bookmark.
"A masik meg az, hogy erzekeny oldalakra SOHA nem megyunk linkre klikk-el. Arra van az address bar history meg a bookmark."
Ez mind szép és jó, de a gyakorlat nem ez. A gyakorlat az, hogy felnövekszik egy facebook-os társadalom, akik mindenhova megosztott linkeken jutnak el, és az életükbene nem láttak egy linket, vagy navigáltak kézzel akárhova, a facebook-ra is úgy kerültek, hogy megnyitották az alkalmazást. A másik véglet a régi kor emberei, akik kényszeresen beleírják a www-t az email címekbe, mert megtanulták, hogy az internet vévévével kezdődik, akik kényszeresen odagondolják a .hu-t mindenhova, és gmail.com helyett gmail.hu-ra küldik nekem a leveleket, stb.
Tudod mi segít? Az hogy "kémkednek" utánunk. Annyira utáljuk, hogy a beírt webcímet elküldi a böngésző, "hazatelefonál" ó jaj! De olyan marhajól jön amikor egy realtime adatbázisból kiderül, hogy az oldal megtévesztő, adatlopós, stb, és szól a böngésző, hogy gond van. Valamit valamiért.
Ismerek egy lányt. Informatikát tanult az egyetemen. Nem hálózattal, biztonsággal, ilyesmivel foglalkozik mondjuk, hanem üzleti igényekkel, stb.
Na ő, ha meg akarja nyitni az akármi.com oldalt, akkor nem beírja a címsorba, hanem behívja a google-t, beírja a kereső mezőbe, és az első találatra kattint.
Mindenki ezt csinálja! Szerintem a google forgalmának legalább a fele ilyenekből adódik. Hiába próbálom nevelni a családomat is, a böngésző címsora mintha nem is lenne, csak a google input mezőjébe lehet írni.
--
"Everybody has a testing environment. Some people are lucky enough to have a totally separate environment to run production in."
"De IMHO nincs olyan CA, amelyik alairna egy ilyen domain-t."
Már, hogyne adna certet rá. Ha bizonyitod, hogy a tied a domain, akkor ad.
Ha esetleg valaki bejelenti, hogy megtévesztő, akkor lehet, hogy egy idő után visszavonja a certet, de addigra már rég késő.
Miért ne adna? Nem a CA feladata eldönteni, hogy a domain megtévesztő-e. A cert csak annyit biztosít, hogy a domain tényleg azé, aki a cert adataiban szerepel.
A domain regisztrátor feladata a védjegybitorlást és hasonlókat kikényszerítenie.
"De IMHO nincs olyan CA, amelyik alairna egy ilyen domain-t."
Olyan biztos vagy te ebben? Olcsó cert-nél kizárt dolognak tartom h. humán jóváhagyás legyen (automatizált minden), ott meg a szkriptekhez meglepődnék ha tartanának egy hatalmas listát a nem-okés nevekről.
Ha egy EV cert-et akarnál venni, ahol papírokkal kell bemenni a CA irodájába egy emberhez, na ott lehet h. hamarabb felvonnák a szemöldöküket, de így gépesített feldolgozásnál...?
--
Nem akarom bántani (de fogom) a "szerzőt", mert hatalmas fordítói munkát végez nap nap után, de az gyalázat, hogy bár annak a töredékét érti, amit fordít, nincs benne igény, hogy akár hozzáértővel, akár fórumon keresztül (mintha az indexnek volna olyanja) tisztázza, hogy egy szakszöveg értelmes-e az ő interpretációjában, illetve hogy - mint itt is - nem hiányzik-e még valami apróság a háttérből.
Amit összehozott, abból Lópénisz József azt szűrheti le, hogy veszélyes nagy G-vel írni a gógölt, a lényeg meg pont nincs sehol.
Mint a Mátyás király által próbára tett okos leány: adott is meg nem is. Csak inverz okból és következménnyel.
Ez így ebben a formában nem igaz. Mármint Qvára nem igaz.
De a termtudtech csapatának képessége és igényessége a blog.hu átlagát se mindig éri el.
Hogy ehhez képest gyűjteményes könyvet tudnak rentábilisan kiadni a f[oe]rdít[oe]tt anyagokból, az a modern kort követő norbiapdét nevű történelmi kor jele és következménye.
Nincs rá idő, mert megelőzik. A FB-os fordítós csapatban egy-egy szakszó néha napokig okoz gondot, mire az adott területen jártas valaki meg tudja mondani a frankót. A fenti esetben valószínűleg az egy-két órás késés sem lett volna vállalható.
Az a lényeg, hogy a domain név egy ideje nem csak alfanumerikus ASCII meg kötőjel lehet, hanem akármilyen unicode string, de ez a háttérben egy speciális, ASCII formában van tárolva a DNS rendszerben (link.
Amikor beírod, hogy magyarország.hu, azt a böngésződ a DNS szervertől `xn--magyarorszg-t7a.hu` formában kérdezi le.
DNS szerverben/forwarderben minden "^xn--" denied. (+ a mail szerverben is).
Lehet hogy fasz meg vaskalapos vagyok. De a domain az ASCII, pont.
Egyébként ugyanígy felveszek ezeket a új csodás fancy domain neveket, amiket már követni se tudok, hogy mikor milyen jön. Az első beeső spam után megy a komplett TLD rejectre.
spammerek mar evek ota alkalmazzak level subject/body szovegben hogy a tartalomszuroket kijatsszak. nem lepne meg ha a phishing levelek url-jeben is talalkoznek vele...
Hozzászólások
Jesus, mi ez??
van az utf8-ban egy "G"-re elegge hasonlito "ɢ" karakter. Ezzel a specialis karaterrel regisztralt be valaki egy domaint, ami atiranyit valami furcsa oldalra. (nem az oldal tartalma a lenyeg)
Egy fokkal erdekesebb lenne, ha pl. atiranyitas nelkul egy google bejelentkezesi kepernyonek latszo oldal jonne be....
Vajon az emberek meg tudnak kulonboztetni az Оtp.hu, ⵔtp.hu, Otp.hu, Οtp.hu az Otp.hu-tol ? (mindegyik beirt domain masik, O-nak latszo utf8 karaktert hasznal)
Van M is :)
A ᴍicrosoft.com szabad és csak 8.99 USD (na meg a perköltség ami utána esedékes :P)
Vajon ezt beregisztralva billgates@ᴍicrosoft.com email cimmel tudnek barkivel levelezgetni valid spf rekord mellett?
Azt nem tudom, de tutira felhívnád magadra a legal department figyelmét. :)
En neha szoktam whois ellenorzest csinalni ip-re. Nade: ha valaki epp MS Azure -hoz tartozo VPS -t hasznalna? :)
szerintem az email kliensek idna encodeolják a domaint, de ki kell próbálni:)
Hello NoScript. :^)
Az hol segit ezen?
Hát nem tudom... Mondjuk az eredetire megszólalásig hasonlító oldalon, az eszköztáron a nagy piros karikával áthúzott „S” betű hatására lehet elgondolkodnék milyen oldalon is vagyok valójában. Ha csak nem a FlagFox által mutatott, a megszokottól eltérő mintázatú zászló nem szúrja ki előbb a szemem.
Mire a zemberek végre rászoknak, hogy sasolják a kis lakatocskát, eljön az a boldog kor, hogy az UTF-8 karakterkészletet is át kell tanulmányozniuk.
[törölve, duplikált]
Mondjuk lehet azoknak kéne áttanulmányozniuk, akik csinálják, és nem csinálni olyan furcsaságokat miszerint
Szerk: A fórummotor elnyelte a bejegyzésem végét, vélhetően mert mindenféle spéci unicode karaktereket raktam bele, és a mysql sajnos bénán kezeli (utf8 != utf8mb4). Mindenesetre itt a bejegyzésem: http://pastebin.com/raw/Y0w04VfY
Karakterek összevonására: ezt pont magyar nyelvűként értékelhetnéd (cs,dz,dzs,gy,sz,ty)... persze a nagy része nincs benne az Unicodeban és az Unicode Consortium hivatalos álláspontja, hogy soha nem is lesz, mert az összes meglévő doksit át kéne kódolni az egyértelmű használatukhoz, úgyhogy inkább kódold át az összes doksidat és tegyél az összetartozó karakterek közé egy null-szélességű, összetartozást jelölő karaktert (és tényleg ez az érvelésük és a kínált megoldásuk)
Emoji: szintén az alma szabadította ránk azt a rettenetet, amikor be akart törni a Japán piacra, ahol a rengeteg gyártónak a szabad karakter-helyeken voltak gyártóspecifikus képei/ikonjai. Aztán az apple tett a nem-japán iphoneokba is egy emoji billentyűzetet, az eredményét meg lehet látni :( [de legalább már van skin tone modifier, úgyhogy vigyoroghatsz bármilyen bőrszínnel, szóval nemzetközi...]
Az speciel már a Unicode 6.0-ban is volt (az első változat emoji támogatással) :( [vajon a szar ikonra is működik a szín modifier?]
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
Nem a magyar az egyetlen nyelv, amelyik 2 v. több egymás mellé kerülő latin betűnek az elemektől eltérő kiejtést társít, de nem tudok másikról (ez nem jelent semmit), ahol az ebből eredő problémák ellenére (házsor < házsártos) ragaszkodnának ahhoz, hogy ezek a betűtalálkozások újabb betűket érjenek, amelyeknek rendezéskor saját értékük van.
Pedig senki sem tart pisztoly a fejünkhöz, hogy ezt tegyük, és az "így alakult ki" sem lehet érv, hiszen az MTA n+1-edik onanizálásának kimenete rendre az, hogy tesznek rá, hogy mi hogyan alakult ki.
" amelyik 2 v. több egymás mellé kerülő latin betűnek az elemektől eltérő kiejtést társít"
Nem erről van szó. A cs, dz, dzs és társai nem több betűk egymás mellett. Az egy darab betű a magyar ábécében. Csak éppen két latin ábécés karakterképpel/írásjeggyel tudjuk leírni. De attól még a gy is egy külön eleme a magyar ábécének (azaz betű), nem g + y egymás mellett.
És épp ezért lehet megoldani a házsártos/házsor problémát úgy, hogy amikor az elsőt akarod írni, más Unicode karaktert használsz (ami a zs betűt kódolja, mégha a képe olyan, MINTHA egy z és egy s lenne egymás mellett), amikor a másodikat írod, akkor két Unicode karaktert használsz. És akkor a gép számára (pl. helyesírásellenőrzőnek) egyértelmű lesz, hogy milyen betű van ott - és tudni fogja, hogy nem is lehet ház-sártosként elválasztani stb.
Azért ugye értetted, amit írtam?
Azért egy betű a cs, és nem cé-es, mert mi azt mondjuk, hogy az legyen. Pedig erre semmi okunk. Ahogy a svéd se vezeti magát a falnak azzal, hogy azt mondja, hogy "mivel az ng meg az skj saját hangot jelöl, az ng meg az skj EGY betű", hanem aszondja, hogy a hang az hang, a betű meg betű; az ng két betű, aminek történetesen egy se-n-se-g hangalakja van.
Nincs rá oka, hogy máshogy fogja fel, mert semmit sem nyerne a réven csak veszítene a vámon.
A magyar nyelv ilyen egyszerűsítések után is informatikai kihívás volna, de momentán rémálom.
De, van rá okunk. Ez a magyar ábécé. Amikor áttértünk a rovásírásról (ahol a csének külön jele volt) a latin betűs írásra, probléma is volt, nem tudták, hogyan lehet a latin ábécével magyar betűket kódolni. Emiatt olyan a Halotti Beszéd illetve az ómagyar Mária-siralom, amilyen. Az egy tök magyar szöveg, csak nem tudták, hogyan lehet jól leírni latin betűkkel például azt a szót, amit ma már így írunk: gyümölcs. Mert akkor valahogy így írták: gimilcíctul . De azt írt: gyömölcsétől.
Épp ezért egy betű a csé a magyar nyelvben. Csak éppen két latin karakterrel kódoljuk, mert már latin ábécével (illetve annak egy variánsával) írunk, és nem rovással. Rovásban van is külön karaktere a csé betűnek.
Ne feledd: a nyelv nem ugyanaz, mint annak írása. A magyar nyelvben van csé betű. Ezt a magyar ábécében (ami latin betűs írás) cs-vel kódoljuk.
Azért egy betű a csé és nem cs, mert a csé egy külön betű. Amit írhatnánk úgy is akár, hogy č, ahogy a szlávok teszik. De mi cs-sel kódoljuk.
Régen meg totál máshogy kódoltuk: https://hu.wikipedia.org/wiki/Sz%C3%A9kely%E2%80%93magyar_rov%C3%A1s%C3…
Láthatod, a csé hang képének semmi köze a cé és az es hang képének egymásutánjához. Ez egy külön hang, ami a magyar nyelv és ábécé része.
Innen végtelen hurok volna.
http://www.taneszkozcentrum.hu/products/full/0005.jpg
Én azért többé-kevésbé még mindig az MTA-t és az Unicode Consortiumot hibáztatom (eddig nem kerültek be a digraphjaink/trigraphunk, most már nem is fog), még ha mindkét felet meg is értem (az MTA szerintem csak nem foglalkozott ezzel, az UC viszont nagyon megszívná, ha egy nyelvnek megengedné, mert akkor mindenkinek kéne).
Egyébként az UC véleménye védhető is, a legtöbb digraph a használat szempontjából lényegtelen, mert nem tagjai az adott nyelv ABC-jének (de legalábbis vitatkoznak róla, pl. AFAIK a hollandok az IJ digraphjukról nem bírják eldönteni - de annak legalább van code pointja...). Szvsz. nálunk viszont pont azért, mert tagja az ABC-nek, _minden_ műveletben (rendezés, rövidítés [Csaba néven publikálni marha nagy szívás, mert mindenki rosszul fog rád hivatkozni az automatizációk miatt], elválasztás stb.) szerepe van, így megérdemelték volna azt a néhány a kódpontot.
És akkor már teljesen off: a legalja, amikor hosszasan szívsz azzal, hogy amennyire lehet, helyesen rendezd a dolgokat (hosszasan szívsz itt ugye annyi, lősz egy rendes collate-t :) ), aztán jön az ÜF, hogy miért vannak egyben az A és az Á betűvel kezdőd elemek a listában. Mert úgy helyes. De nem úgy helyes, előbb az A, aztán az Á. Magyar Helyesírási Szabálykönyv felcsap, megmutat. Jó, de ez így akkor se jó...
BlackY
--
"en is amikor bejovok dolgozni, nem egy pc-t [..] kapcsolok be, hanem a mainframe-et..." (sj)
Teljesen érthető az ügyfél (még ha igaza de jure nincs is). A betűzés után a 2. dolog volt, amit megtanítottak neki, az aábécécsédé volt, és az még meg is maradt, már csak azért is, mert együtt újra át kellett darálni a gyerekkel. Nem úgy, mint a szótári rendezést, amit hatodikban (se) tanult meg, és azóta se tűnt fel (vagy szabálykövető, vagy nem) szótárak használatakor a turpisság.
Emellett még intuitívabb is VOLNA leszögezni, hogy ha egyszer van olyan, hogy Á, ami nem ugyanaz, mint az A, akkor tényleg ne legyen ugyanaz.
Rendre visszatérő önhízelgés, hogy "a magyar... az olyan mérnöki nyelv". Az, ha a dátumot és a családnév-keresztnév formát nézzük, máshol viszont üvölt, hogy bölcsészek (no offense) kalapálják.
- o -
Arra pedig tényleg kíváncsi volnék, hogy az UC Con. nem gondolt ilyenre, vagy gondolt, csak hangosabbak voltak azok az érvelők, akik aszonták, hogy "ugyan mi rossz is származhatna abból, ha két DN ránézésre (mármint ha ember - aki ilyen DN-eket általában használni szokott - ránéz) ugyanaz!?"
A rovások viszont benne vannak az UTF-8-ban és lehet is használni :-).
Olasz.
Persze, hiszen Pink Floyd!
[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS
mi ebben az újdonság?
https://en.wikipedia.org/wiki/IDN_homograph_attack
Hat pedig ez engem is meglepett. Nem a teny, hogy hasznalhato, hanem az, hogy siman beneztem.
"Biztos jo otlet volt UTF8 domain neveket engedelyezni?"
Megcsinálhatták volna úgy is, hogy megfelelő tld esetén megfelelő karakterek engedélyezettek. Mi oka lenne valakinek cirill betűket rakni egy nemzetközi brand nevébe? Cserébe egy orosz/ukrán, stb oldal esetében (ami célszerűen adott ország tld-je alá tartozik) van értelme
http://kb.mozillazine.org/Network.IDN_show_punycode
Eközben a Microsoftnál:
November 10, 2016 Excel: Feature updates
- CSV (UTF-8) support: Open and save CSV files that use UTF-8 character encoding.
best
uristen es tenyleg: http://answers.microsoft.com/en-us/msoffice/forum/msoffice_install-mso_win10/announcing-october-feature-update-for-office-2016/927eea90-eea3-479a-a78a-45f7612460e1
Az is érdekes, hogy hol lehet találkozni a fenti oldallal, nekem pl. pár napja az google analyticsemet piszkolta tele... :)
Ezert kell figyelni a https pici ikonjat ott felul. Ne adj isten, ha csak klikk-el mentel valahova, akkor klatty ra es csekk, hogy ki a certificate issuer. De IMHO nincs olyan CA, amelyik alairna egy ilyen domain-t.
A masik meg az, hogy erzekeny oldalakra SOHA nem megyunk linkre klikk-el. Arra van az address bar history meg a bookmark.
Nem sokra mész vele, ha látod, hogy a ɢoogle.com címed tényleg ɢoogle.com
"A masik meg az, hogy erzekeny oldalakra SOHA nem megyunk linkre klikk-el. Arra van az address bar history meg a bookmark."
Ez mind szép és jó, de a gyakorlat nem ez. A gyakorlat az, hogy felnövekszik egy facebook-os társadalom, akik mindenhova megosztott linkeken jutnak el, és az életükbene nem láttak egy linket, vagy navigáltak kézzel akárhova, a facebook-ra is úgy kerültek, hogy megnyitották az alkalmazást. A másik véglet a régi kor emberei, akik kényszeresen beleírják a www-t az email címekbe, mert megtanulták, hogy az internet vévévével kezdődik, akik kényszeresen odagondolják a .hu-t mindenhova, és gmail.com helyett gmail.hu-ra küldik nekem a leveleket, stb.
Tudod mi segít? Az hogy "kémkednek" utánunk. Annyira utáljuk, hogy a beírt webcímet elküldi a böngésző, "hazatelefonál" ó jaj! De olyan marhajól jön amikor egy realtime adatbázisból kiderül, hogy az oldal megtévesztő, adatlopós, stb, és szól a böngésző, hogy gond van. Valamit valamiért.
Ismerek egy lányt. Informatikát tanult az egyetemen. Nem hálózattal, biztonsággal, ilyesmivel foglalkozik mondjuk, hanem üzleti igényekkel, stb.
Na ő, ha meg akarja nyitni az akármi.com oldalt, akkor nem beírja a címsorba, hanem behívja a google-t, beírja a kereső mezőbe, és az első találatra kattint.
OK, várhatóan a google a jó oldalt adja vissza.
De ha nem?
Mindenki ezt csinálja! Szerintem a google forgalmának legalább a fele ilyenekből adódik. Hiába próbálom nevelni a családomat is, a böngésző címsora mintha nem is lenne, csak a google input mezőjébe lehet írni.
--
"Everybody has a testing environment. Some people are lucky enough to have a totally separate environment to run production in."
https://letsencrypt.org/ szerintem barkinek ad
"De IMHO nincs olyan CA, amelyik alairna egy ilyen domain-t."
Már, hogyne adna certet rá. Ha bizonyitod, hogy a tied a domain, akkor ad.
Ha esetleg valaki bejelenti, hogy megtévesztő, akkor lehet, hogy egy idő után visszavonja a certet, de addigra már rég késő.
Kevert utf-8 es us-ascii karakterekre? ahol az utf-8 -bol csak a latin betuknek latszokat hasznaljak? elegge nagy luzerseg lenne!
Miért ne adna? Nem a CA feladata eldönteni, hogy a domain megtévesztő-e. A cert csak annyit biztosít, hogy a domain tényleg azé, aki a cert adataiban szerepel.
A domain regisztrátor feladata a védjegybitorlást és hasonlókat kikényszerítenie.
"De IMHO nincs olyan CA, amelyik alairna egy ilyen domain-t."
Olyan biztos vagy te ebben? Olcsó cert-nél kizárt dolognak tartom h. humán jóváhagyás legyen (automatizált minden), ott meg a szkriptekhez meglepődnék ha tartanának egy hatalmas listát a nem-okés nevekről.
Ha egy EV cert-et akarnál venni, ahol papírokkal kell bemenni a CA irodájába egy emberhez, na ott lehet h. hamarabb felvonnák a szemöldöküket, de így gépesített feldolgozásnál...?
--
ezek: #comment-2089460?
--
blogom
Let's Encryptes, géppel létrehozott, automatikus certek, nem EV certek.
és ők technikailag nem felelnek meg a nincs olyan CA tagadásának?
Ki írja alá a nem EV certeket akkor, ha nem egy bármely CA?
--
blogom
Egy eloadas 2014-bol amiben ez le volt irva, de vannak meg mas finomsagok is:
http://seriot.ch/resources/talks_papers/20141106_asfws_unicode_hacks.pdf
szerintem ez durvább volt amikor left-to-right karakterrel fel lehetett cserélni a domain nevet és a path-t:
http://www.rafayhackingarticles.net/2016/08/google-chrome-firefox-addre…
http://index.hu/tech/2016/11/22/vigyazat_a_google-t_is_hamisitjak/
Nem akarom bántani (de fogom) a "szerzőt", mert hatalmas fordítói munkát végez nap nap után, de az gyalázat, hogy bár annak a töredékét érti, amit fordít, nincs benne igény, hogy akár hozzáértővel, akár fórumon keresztül (mintha az indexnek volna olyanja) tisztázza, hogy egy szakszöveg értelmes-e az ő interpretációjában, illetve hogy - mint itt is - nem hiányzik-e még valami apróság a háttérből.
Amit összehozott, abból Lópénisz József azt szűrheti le, hogy veszélyes nagy G-vel írni a gógölt, a lényeg meg pont nincs sehol.
Mint a Mátyás király által próbára tett okos leány: adott is meg nem is. Csak inverz okból és következménnyel.
Mégis mit vártál attól az oldaltól? Csak ehhez ért.
Ez így ebben a formában nem igaz. Mármint Qvára nem igaz.
De a termtudtech csapatának képessége és igényessége a blog.hu átlagát se mindig éri el.
Hogy ehhez képest gyűjteményes könyvet tudnak rentábilisan kiadni a f[oe]rdít[oe]tt anyagokból, az a modern kort követő norbiapdét nevű történelmi kor jele és következménye.
Nincs rá idő, mert megelőzik. A FB-os fordítós csapatban egy-egy szakszó néha napokig okoz gondot, mire az adott területen jártas valaki meg tudja mondani a frankót. A fenti esetben valószínűleg az egy-két órás késés sem lett volna vállalható.
Elfogadhatatlan.
Az írni bármit, csak minél gyorsabban írva legyen a bulvár kenyere!
Írnám tovább is, hogy miért, de attól egy perc alatt "irányba állna" a topic.
https://www.аррӏе.com vs https://www.apple.com
https://www.еріс.com vs https://www.epic.com
keresd a különbséget!
ja, szívás.
https://www.wordfence.com/blog/2017/04/chrome-firefox-unicode-phishing/
-------------------------------------------------
How to fix this in Firefox:
In your firefox location bar, type ‘about:config’ without quotes.
Do a search for ‘punycode’ without quotes.
You should see a parameter titled: network.IDN_show_punycode
Change the value from false to true.
-------------------------------------------------
Can I fix this if I use Chrome?
Currently we are not aware of a manual fix in Chrome for this.
-------------------------------------------------
update: Chrome 59 To Address Punycode Phishing Attack
https://tech.slashdot.org/story/17/04/17/1329200/chrome-59-to-address-p…
Az 58-as Chrome-ban érkezik: https://www.xudongz.com/blog/2017/idn-phishing/
--
DigitalOcean $10 ajándék
Jol ertem, hogy bevezettek az unicode URL-eket, csak azert, hogy utana visszaalakitsak ASCII-va?
Az a lényeg, hogy a domain név egy ideje nem csak alfanumerikus ASCII meg kötőjel lehet, hanem akármilyen unicode string, de ez a háttérben egy speciális, ASCII formában van tárolva a DNS rendszerben (link.
Amikor beírod, hogy magyarország.hu, azt a böngésződ a DNS szervertől `xn--magyarorszg-t7a.hu` formában kérdezi le.
Köszi a FF leírást!
Hú, ez a második páros óriási genyaság. Ilyet tényleg nem lenne szabad engedniük.
Ez nagyon meredek.. kössz a tippet!
--
durva
--
http://naszta.hu
"Egyszerű"
DNS szerverben/forwarderben minden "^xn--" denied. (+ a mail szerverben is).
Lehet hogy fasz meg vaskalapos vagyok. De a domain az ASCII, pont.
Egyébként ugyanígy felveszek ezeket a új csodás fancy domain neveket, amiket már követni se tudok, hogy mikor milyen jön. Az első beeső spam után megy a komplett TLD rejectre.
"Sose a gép a hülye."
Nekrofil :)
LOL
spammerek mar evek ota alkalmazzak level subject/body szovegben hogy a tartalomszuroket kijatsszak. nem lepne meg ha a phishing levelek url-jeben is talalkoznek vele...
A'rpi
https://util.unicode.org/UnicodeJsps/confusables.jsp