Kutatók szerint a ChatGPT-4 átment a Turing-teszten

Címkék

Én:

Mi a Turing-teszt pár szóban?

ChatGPT:

A Turing-teszt egy mesterséges intelligencia teszt, amelyet Alan Turing javasolt. Lényege, hogy megállapítsa, vajon egy gép képes-e az emberéhez hasonló intelligens viselkedést mutatni. A teszt során egy emberi bíró írásban kommunikál mind a géppel, mind egy másik emberrel, és ha a bíró nem tudja megbízhatóan megkülönböztetni a gép válaszait az emberi válaszoktól, akkor a gép sikeresen teljesítette a tesztet.

Én:

Friss hír: A ChatGPT-4 sikeresen teljesítette a Turing-tesztet. Mit szólsz ehhez?

ChatGPT:

Ez lenyűgöző hír, és jelentős mérföldkő a mesterséges intelligencia fejlődésében. Ha a ChatGPT-4 valóban sikeresen teljesítette a Turing-tesztet, az azt jelenti, hogy képes olyan szinten kommunikálni, amely megkülönböztethetetlenné teszi az emberi kommunikációtól. Ez számos lehetőséget nyit meg az AI alkalmazások terén, ugyanakkor komoly etikai és biztonsági kérdéseket is felvet. Fontos lesz alaposan megvizsgálni, hogyan lehet ezt a technológiát felelősségteljesen és biztonságosan integrálni a különböző iparágakba és a mindennapi életbe.

Részletek itt és itt.

Hozzászólások

54% of the time, outperforming ELIZA (22%) but lagging behind actual humans (67%)
ásít

[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS

Szerkesztve: 2024. 06. 16., v – 14:17

Áh, ez semmi. Igazából csak a következő tokent jósolja meg, nincs intelligenciája.

Csupán statisztika átcímkézve.

Asszonykám elkezdte kiszórni a kegyvesztett játékokat FB marketplacen... néha mutogatja hogy kommunikálnak a vevők és szabályosan fáj olvasni. Eszméletlen sötétség van, számolni nem tudnak, írni nem tudnak, központozás teljes hiánya és még sorolhatnám. A legtöbbjükhöz képest egy begombázott chatGPT is nagyságrendekkel értelmesebb beszélgetőpartner. 

Először én sem értettem, hogy szabadult ennyi írástudatlan barom a zinternetre. Aztán ahogy eltűntek a fizikai gombos mobilok, pár éve eltűntek a desktop pc-k is nagyrészt a háztartásokból (ugye kovid elején már sok iskoláskorú gyerek nem tudta megoldani a számítógépes tanulást), már megvilágosodtam h. a "mobilon/ touch-on szar gépelni" eredményét látjuk csupán. Max. az igényesség jele, ha ezek 1 kis része veszi a fáradtságot és kijavítja a hibái egy részét. A többi szimplán csak leszarja, a másik oldal úgyis kódfejtő, és megérti. Vagy ugyanolyan hülye mint ő maga, és egy nyelvet beszélnek, így szintén megértik egymást.

Néhány megbeszélésen elsütöttem a kollégáknak a viccet hogy szerintem vissza kellene térni a hieroglifák használatára, minek az a sok betű.

 

Anno volt olyan hogy krokodil, víz, halálfej. Most már van mosolyfejek, vagy akár "két gyűrű, királyi korona" és máris utalhatunk a gyűrűk ura filmre, beszélni, írni sem kell, nemhogy vesződni analóg órával meg hogyisne tovább menjek, kézírással! Össze ne kössék a nebulók a dolgokat folyamatban gondolkodva, elég csak dobozonként egymáshoz illeszteni a dolgokat mint az Ikea bash script jellegű bútorait, nehogy valaki még a végén átlásson egy rendszert bármilyen területen!

Jó is h. mondod ikea bútorok: szerintem miattuk van már csak hieroglifás bútorösszeszerelő leírás, emberi nyelven már nem írnak le 1 kibaszott összeszerelési útmutatót sem. Sakkozza ki a paraszt abból a kis szar ábrából, amin sokszor se a pozicionálást, se a lényegi részeket nem lehet kivenni. Szöveges segítség pedig már nincs ott, h. mégis mi a faszt kéne csinálni adott munkafolyamatnál. Csak 1 szempár ami les, meg 1 fül hogy KLIKKK. A jó édes anyjukat az ikeának. A többi bútoros cégnek meg h. átvették tőlük ezt az agyrákot. Csak a kisebbek ráadásul még szarul is.

Ha már kiütötték és tönkretették az adott országban működő  bútorkészítő cégek nagyrészét, a bútorasztalosok mehettek más munka után nézni (az is olyan hiányszakma lett, mint a többi amikor kell valami várhatsz a nemkontárra 6 hónapokat) , akkor talán belefért volna a haszonkulcsba az adott leigázott ország nyelvén leírni az összeszerelési útmutatót.

De most h. már a nyelvet se beszélik, egyre sűrűbben látom a tényleg google fordítóval készült szemetet. 20 éve a dvd játékos meg a tündérdöme (aki nem ismerné: Thunderdome) még extrém, megröhögnivaló elrettentő példák voltak. Ma meg a lidl-ben vett fülhőmérő "magyar" nyelvű használatijában olvasok olyan blőd baromságokat, amik az angol változatból lettek tükörfordítással, értelem és kontextus nélkül átfordítva. Lassan tényleg már az angol változatot kell megtartanom, mert abból megértem mit kell csinálni, a magyaron meg csak fogom a fejemet, mikor többjelentésű szavaknak gondolkodás nélkül automatikusan a szótár szerinti 1. jelentését basszák bele a fordított változatba.

Tehát akkor kőccségcsökkentés és helyette marad a hieroglifa :(

Én is látok ilyen útmutatókat és ezekben az az ijesztő számomra, hogy még a DeepL is jobban fordít ingyen, tehát pontosan hogy a fenébe állhatnak elő ilyen undorító alig-szöveg magyarnak csúfolt macskakaparással? Legacy szoftver? Alulfizetett kínai gyerekmunkás szótárral a kezében? Vagy mégis mi a fene lehet a titka ennek a "minőségnek"?

[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS

Érdekes, én pont kifejezetten jónak tartom, hogy az IKEÁs összeszerelő útmutatók szöveg nélkül is jól érthetők, és nem kell valami obskurus bikkfanyelven írt, és szarul fordított leírásból, meg egy olyan fos robbantott ábrából, amiből kb egyelő eséllyel lehet szekrény, tank vagy repülő megpróbálni összerakni a bútort. Semmi szükségem rá, hogy "12.4 - addig nyomja lefele az elemet, amíg határozott, kattanó hangot nem hall", sokkal jobb egy 48-as klikk felirat, az információtartalma ugyanaz, az értelmezése nagyságrendekkel gyorsabb.

Mondjuk az, aki nem kepes osszerakni egy IKEA butort nehany rajz alapjan, az meg is erdemli. Persze a mikrora is rairjuk, hogy a macskat ne ott szaritsd...

 

Ugy egyebkent eljuthatnank erre a szintre az szoftverek (legalabb alap deployment) vilagaban is. Ha a SW keszito szakipar szerint ez "lehetetlen, mert a mi rendszerunk sokkal bonyolultabb", akkor, szvsz, csak keptelen kezelni az altala letrehozott szornyet.

Mondjuk az, aki nem kepes osszerakni egy IKEA butort nehany rajz alapjan, az meg is erdemli. Persze a mikrora is rairjuk, hogy a macskat ne ott szaritsd...

 Azért volt furcsa nekem a kritika, mert én pont azt látom, hogy az ikea kifejezetten hangsúlyt fektet arra, hogy jók legyenek a szerelési útmutatói, át van gondolva, mindent lehet pont úgy csinálni, hozzá fogsz férni, nem fog megborulni, ilyesmi. Igazából akkor baszol ki magaddal, amikor okosabb akarsz lenni, olyankor többnyire lesz Sheldonos "Why? Why? .... Oh, that's why." pillanat.

Ugy egyebkent eljuthatnank erre a szintre az szoftverek (legalabb alap deployment) vilagaban is. Ha a SW keszito szakipar szerint ez "lehetetlen, mert a mi rendszerunk sokkal bonyolultabb", akkor, szvsz, csak keptelen kezelni az altala letrehozott szornyet.

Azért egyébként ez szerintem alakul. Maguk a softwarek is azért gyakrabban jönnek valami sane default működéssel, meg sokat segít ezen egy csomó technológia csomagolásra, docker, appimage stb, de az se véletlen, hogy pl a go programok adnak egy darab binárist, aztán jóidő. Én azért azt tapasztalom, hogy cuccok nagyrészét elég gyorsan működőre lehet pofozni, legalább egy kipróbálás erejéig.  (Persze nyilván benne van az is, hogy nem ma kezdtem)

De egyébként, ja: https://rodgersnotes.wordpress.com/2010/10/25/google-and-apple-versus-y…

Ha megtartja az idézett részben is megcsillantott helyesírását, akkor továbbra is jó eséllyel nézik majd embernek. :D

Szerkesztve: 2024. 06. 16., v – 20:52

Az az 54% elég karcsú, mint ne mondjak.

Egyébként meg nem azért, de ez a Turing teszt semmit nem ér, az alábbi program is átment rajta 99%-os pontossággal:

mondd "Szerintem Te vagy a gép!"
ciklus amíg 1
    válaszravár
    mondd előgyárott_válaszok_amik_bizonygatják_hogy_márpedig_de[rand()]
ciklusvége

Pedig ez aztán tényleg nem nevezhető "intelligenciának"...

Nem véletlen, hogy soha sem volt értelmes emberek szerint valódi tesznek szánva, ez csak egy gondolatkísérlet volt amit Turing javasolt 3 résztvevővel, hogy leváltsa a szerinte parttalan vitát az öntudat felőli megközelítésről.

[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS

Erre nem tudok egy hozzászólásban válaszolni, Lovelace kritikája például a kreativitással függött össze, sokan a mai napig is pl. ezen a vonalon indulnak el. De ez is olyan téma, hogy az emberi kreativitást is sokan kérdőjelezték már meg az írott történelem folyamán és főleg így elég nehéz értelmes kritériumokat felállítani rá. Az sem teljesen egyértelmű mi a kérdés, vagy mit akarunk tesztelni, pont erről írt Turing is.

[insert line here]
B.C. 3500 - DIY Vehicle / A.D. 30 - DIY Religion / A.D. 1991 - DIY OS

Igen, pont ez az érzésem, hogyha kommunikációsan megkülönböztethetetlen (lesz) az embertől, akkor ha megkérdőjelezi valaki valamiben az AI-t, pont ugyanúgy megkérdőjelezheti az embert is. És ha az embernél nem kérdőjelez meg valamit, akkor nehéz megmagyaráznia, hogy az AI nál miért igen. Ez pedig egy igen jelentős dolognak, nagy lépésnek tűnik. Szóval akármit is jelent ez nekem úgy tűnik, hogy itt nehéz legyinteni.

Most néztem az Atlas-t - egyszer nézhető -, az az elképzelt AI tetszik.

Szamitasaim szerint az AI nagyjabol akkor fogja elvenni a munkamat amikor mar vegervenyesen a tokom tele lesz az IT-val. Sot, egy kicsit nem artana ha bele is huzna.

Szerkesztve: 2024. 06. 18., k – 15:53

WTF? Nem úgy van, hogy ember sem megy át a Turing teszten? Adj be csak neki egyetlen olyan algoritmust, ami egy bizonyítatlan matematikai sejtést akarna megcáfolni (pl. Fermat).

szerk: elnézést, ezzel kevertem: https://en.wikipedia.org/wiki/Halting_problem

Van egy kolléganőm, aki tutti, hogy nem menne át a Turing-teszten. Kérdezel tőle valamit, erre megismétli a kérdésedet néhány töltelékszóval súlyosbítva, majd elkezd valami általános bullshitelésbe, ahelyett, hogy a pontosan feltett kérdésre rövid, egzakt választ adna. Pont, mint a ChatGPT.

Ez tipikusan olyan, amibe "kezzel belenyultak". Az LLM reteg emberi inputbol tanult, ott meg 0 darab olyan volt, hogy "AI rendszerkent nincsenek erzeseim". Valoszinu a nagy reszet megerintette a tortenet (nem tudom, nekem nem ismeros).

A strange game. The only winning move is not to play. How about a nice game of chess?

I'm not scared of a computer passing the turing test... I'm terrified of one that intentionally fails it.