AI Engineering Demo Day 2025 [teljes felvétel közkívánatra]

Címkék

Az eseményen 3 különböző területen dolgozó csapat mutatta meg élőben, hogyan is használják az AI-t.

Az AI fénysebességgel tört rá az informatikai szakmára, alaposan megosztva a közösséget. A skála széles, vannak egzisztenciális szorongók, AI-haterek, szkeptikusok, ismerkedők és kísérletezők, és persze az élenjárók. A fejlődés sebessége miatt a közösség kompetenciákban is szétszakadni látszik. Felkértünk 3 különböző területen dolgozó csapatot, mutassák meg élőben, hogyan is használják ők az AI-t, ezután pedig mindenki eldöntheti, mit gondol az egészről, hol is tart az adaptációban. A demók után pedig beszélhettünk a csapattagokkal, ki fog derülni, hogy mennyi munkát raktak ebbe, mit javasolnak a tanuláshoz. A felvétel az IT karrier fókuszú Kraftie eseménysorozat 2025. november 17-i, AI ENGINEERING DEMO DAY 2025 című állomásán készült.

Hozzászólások

Adatelemzés nagy mennyiségű kommenten

Elmondom, mit láttam, hallottam ebben a szakaszban (28:26-47:40):

Adott egy dolgozó, akinek termékfejlesztés és ügyfélismeret a feladata. Ahelyett, hogy (társaival együtt) elolvasná, és emberi intelligenciájával elemezné, csoportosítaná a rá eső, emberek által megírt javaslat/visszajelzés-csomagot, amely 100 kommentből áll, és kb. 90 percét venné igénybe, bedobja az egészet egy gépbe. (Ne feledjük, az ügyfelek a véleményüket olyan dobozba gépelték be, amely felett ez a kérdés (vagy hasonló) áll: "mit csinálhatnánk jobban?" Más szóval a kérdésfeltevés és a válasz személyes, a válasz feldolgozása viszont teljesen személytelen.) A gép pillanatok alatt kiköp valamit, amiről aztán elhiszi, hogy az a "többség igénye". (41:42: "egy párba beleolvasunk, hogy nem hallucinált-e [...] nagyjából stimmel".)

Konkrét statisztikai, matematikai módszerekről nem tesz említést, úgyhogy garantálom, hogy a végeredményben (~42:22) súlyos hibáknak kell lenniük; az LLM-ek matematikára nem jók. A 42:37-nél található felszólítás ("ne hallucinálj") pedig abszurd; legjobb esetben is csak arra szólíthatná fel, hogy dokumentálja a pontos levezetést.

Utána panaszkodik egy sort (42:50, 46:48), mert a többség ilyetén módon leszűrt igényét -- a tanulságokat -- az AI nem formázza egyből egy prezentációba is (amit neki elég lenne a következő értekezleten csak felolvasnia / bemutatnia); kénytelen a prezentációt maga elkészíteni.

Az AI-t messiásként üdvözlő dolgozói véleményekben (akárhol olvastam is azokat) felismertem egy közös motívumot: e vélemények vallói nem szeretik a munkájukat végezni. A munkájuknak az eredménye érdekli őket (= végső soron az, hogy "valaki" csinálja meg a munkát, lehetőleg helyettük, de fizetni azért őket fizessék ki); a munkájuk konkrét elvégzése nem motiválja őket.

Én nem tudom, hogyan lehet így élni. Abszolút nem értek egyet a "work to live" szlogennel. Szerintem az embernek lehetőleg legyen hivatása. Az életnek több rétegben van értelme az ember számára, és ezen rétegek egyike a munka. Túl sok időt töltünk ahhoz munkával, hogy zárójelbe tehessük.

Isten őrizz, hogy egy ügyfélismeretért felelős dolgozó egy-két napig hús-vér ügyfelek által begépelt visszajelzéseket olvasson -- és ezáltal tényleg megismerje az ügyfeleket --, miközben a vasárnapi reggeli közben a gép 35 perc alatt elvégzi a feladatot! /s

Az adódó kérdés: ha az AI eszközük olyan okos lesz, hogy már mind a prompt-ot, mind a prezentációt kiköpi magától, sőt, az utóbbit fel is olvassa az értekezleten (szintetizált beszéddel), akkor az adott dolgozóra, akinek mindez a munka büdös (hiszen nem élvezi csinálni), kinek és mi szüksége lesz még? Hiszen még az LLM által kiböffentett szöveges elemzést sincs kedve elolvasni (44:31), inkább legyen minden színes-szagos, interaktív; minél kevesebb mentális erőfeszítést kelljen tenni!

(A 38:01-nél megjelenített megbízás szó szerint azzal kezdődik, hogy "You are a helpful product manager analysing NPS comments". Az LLM-mel önmagát személyesíti meg, önmagát helyettesíti.

További érdekesség ugyanitt, hogy kifejezetten nem érdeklik olyan ügyfélvisszajelzések, amelyekből az LLM nem tud leszűrni megfogható, végrehajtható tennivalót. Tehát olyan visszajelzések, amelyekhez kicsit nagyobb távlatban kellene gondolkodni -- vigyázat! humán intelligencia! fúj! --, egyből mennek a /dev/null-ba.)

Amit pedig 47:12-nél kiküszöbölendő "elfogultságként" (bias) említ, az valójában a tapasztalat és szakértelem; éppen az, ami a munkájának az értelme és a belsőleges motivációja lenne. Ideális esetben statisztikai eszköz igénybe vétele mellett át kellene olvasniuk egyesével az összes visszajelzést, és a kétféleképpen leszűrt tanulságokat ütköztetniük kellene.

Elkeserítő.

A többit már nem is volt kedvem megnézni.

Nyugtass meg, használsz gépeket, ugye? Miben más egy számológép, ami a végén összegzi a számokat, mint egy olvasógép, ami a végén összegzi az olvasottakat? Hogy hibázik az olvasógép? Hát, van ilyen, a számológép is hibázott eleinte, külön személyzet volt arra, hogy vegyék észre, amikor a számológép hibázik és a hiba típusából és mintázazából megmondták, hogy melyik elektroncsővel lesz a gond. Aztán kinőtte ezt a számológép, az olvasógép is ki fogja nőni ezeket a problémákat.

Nyugtass meg, használsz gépeket, ugye?

Igen.

Miben más egy számológép, ami a végén összegzi a számokat, mint egy olvasógép, ami a végén összegzi az olvasottakat?

Sorolom:

  1. A számológép nem égeti fel a Földet, nem fogyaszt annyi villamos eneriát, mind India teljes lakossága egyébként. (Ehhez nem is keresek linket, tele van vele a sajtó.)
  2. A számológép működését az utolsó bitig értjük. Az AI-ét nem értjük, de ettől még az égvilágon mindenbe belevesszük.
    1. fundamentally [...] unintelligible -- https://x.com/karpathy/status/2004607146781278521
    2. https://en.wikipedia.org/wiki/Geoffrey_Hinton#Risks_of_artificial_intelligence
  3. A számológép nem szerzői jogi szürke zóna.
  4. A számológép nem emberi nyelven kommunikál; nem hozza működésbe azt az evolvált (megalapozott) tulajdonságunkat, tudat alatti meggyőződésünket, hogy a nyelvhasználatot az értelemmel, érzelmekre való képességgel azonosítjuk. A számológépnél így nem áll fenn annak a veszélye, hogy -- annak ellenére, hogy tudjuk, hogy csak egy gép -- paraszociális kapcsolatot alakítsunk ki vele. Because LLMs now not only help me program, I’m starting to rethink my relationship to those machines. I increasingly find it harder not to create parasocial bonds with some of the tools I use. [...] I have tried to train myself for two years, to think of these models as mere token tumblers, but that reductive view does not work for me any longer. -- https://lucumr.pocoo.org/2025/12/22/a-year-of-vibes/

A számológép nem égeti fel a Földet, nem fogyaszt annyi villamos eneriát, mind India teljes lakossága egyébként. (Ehhez nem is keresek linket, tele van vele a sajtó.)

Az ENIAC 300 szorzást tudott másodpercenként és 140 kW teljesítményigénye volt.

A számológép működését az utolsó bitig értjük. Az AI-ét nem értjük, de ettől még az égvilágon mindenbe belevesszük.

És? Egy csomó olyan terület van, ahol nem értjük az utolsó bitig a működést, mégis a társadalom alapja (lásd például egészségügy, szociológia, irodalom, politika és a többi). Honnan jött az igény arra, hogy érteni kell az utolsó bitig? Rengeteg gyógyszernek nem ismerjük a hatásmechanizmusát, csak azt, hogy alapvetően működik, ezért használjuk. Akkor ez se jó?

A számológép nem szerzői jogi szürke zóna.

Ez szimpla szabályozási kérdés, egy csomó szerzői jogi szürke zóna van a számológépekkel is, mindenféle programokat futtatnak, ugye.

A számológép nem emberi nyelven kommunikál; nem hozza működésbe azt az evolvált (megalapozott) tulajdonságunkat, tudat alatti meggyőződésünket, hogy a nyelvhasználatot az értelemmel, érzelmekre való képességgel azonosítjuk.

De azt ugye tudod, hogy egyébként számológépen fut az egész LLM? :)

Egy csomó olyan terület van, ahol nem értjük az utolsó bitig a működést, mégis a társadalom alapja (lásd például egészségügy, szociológia, irodalom, politika és a többi). Honnan jött az igény arra, hogy érteni kell az utolsó bitig? Rengeteg gyógyszernek nem ismerjük a hatásmechanizmusát, csak azt, hogy alapvetően működik, ezért használjuk.

Vártam ezt az ellenvetést.

A választ leírtad: olyan dolgokban nyugszunk bele a "nem értjük"-be -- legjobb példa: bizonyos gyógyszerek --, ahol az adott dolog nélkül megállna az élet.

Az LLM-ek nélkül egyáltalán nem állna meg az élet.

A mérnöki területeken pedig tipikusan az (volt eddig) a megközelítés, hogy ha nem tudod megmagyarázni, akkor nem bízhatsz meg benne; nem fér össze a felelősséggel.

A választ leírtad: olyan dolgokban nyugszunk bele a "nem értjük"-be -- legjobb példa: bizonyos gyógyszerek --, ahol az adott dolog nélkül megállna az élet.

Nem állna meg az élet, éltünk ezen gyógyszerek előtt is. Viszont nehezebb lenne az élet.

Az LLM-ek nélkül egyáltalán nem állna meg az élet.

Nem, csak nehezebb lenne. Azért építünk gépeket, hogy könnyebb legyen az életünk.

A mérnöki területeken pedig tipikusan az (volt eddig) a megközelítés, hogy ha nem tudod megmagyarázni, akkor nem bízhatsz meg benne; nem fér össze a felelősséggel.

Egy csomó ilyen van, amit nem értünk, de használjuk. Mérnöki területen. Nyilván vannak rá közelítő modelljeink, de azok csak közelítő modellek és nem magyarázatok, nem tudjuk, hogy konkértan mi történik ezekben az esetekben. A turbulencia még mindig ilyen, de az elektronika területéről ilyen a kvantumalagút; ilyen a band-gap-effect; ilyen az avalanche-effect; ilyen a FET-ek esetén a subthreshold conduction... és így tovább. Kurva sok olyan dolog van a modern mérnöki területen, amit nem értünk az utolsó bitig, sőt, de használjuk közelítő modellekkel a jelenséget. Az emberiség évezredeken keresztül tudott úgy naptárat készíteni és megjósolni a téli napforduló dátumát és a holdfogyatkozást, hogy konkrétan ismerte volna az égi-mechanikát. Ez manapság se változott, csak sokkal rejtettebbek ezek a fehér foltok.

Nem állna meg az élet, éltünk ezen gyógyszerek előtt is. Viszont nehezebb lenne az élet.

Egy-egy konkrét személyre levetítve (ahogy eredetileg is értettem) ezzel nem értek egyet.

Azért építünk gépeket, hogy könnyebb legyen az életünk.

Én úgy érzem, hogy amit az LLM-ek eddig mutattak, attól bizonyos embereknek talán könnyebb lett az élete, másoknak viszont szegényebb / rosszabb. A kettő (szerintem) borzasztóan nincs egyensúlyban; szerintem a negatív oldal túlsúlyban van.

Egy csomó ilyen van, amit nem értünk, de használjuk. Mérnöki területen.

Ez nagyon érdekes, köszi!

Egy-egy konkrét személyre levetítve (ahogy eredetileg is értettem) ezzel nem értek egyet.

Egy-egy konkrét személyre levetítve az LLM is ugyanúgy segít.

Én úgy érzem, hogy amit az LLM-ek eddig mutattak, attól bizonyos embereknek talán könnyebb lett az élete, másoknak viszont szegényebb / rosszabb.

Hát ez így történt az ENIAC bevezetésével is, addig világszerte kb. ~400-600 ezer embernek volt az a munkaköre, hogy "computer", amint elterjedtek a számológépek, ez a munkakör megszűnt. Most nekik akkor jobb vagy rosszabb lett az életük? Másoknak ettől jobb vagy rosszabb lett az életük?

Ez nagyon érdekes, köszi!

A világ tele van érdekességekkel.

Hát ez így történt az ENIAC bevezetésével is, addig világszerte kb. ~400-600 ezer embernek volt az a munkaköre, hogy "computer", amint elterjedtek a számológépek, ez a munkakör megszűnt. Most nekik akkor jobb vagy rosszabb lett az életük?

Fogalmam sincs. Konkrét példákat tudok (melyeket nyilván nem fogok leírni), amikor az optimalizálás, gépesítés valakit tönkretesz (és elsősorban nem gazdasági okokból), illetve olyat is, amikor -- összgazdasági léptékben jelentéktelen mértékben ugyan, de -- valaki kitartott a "kiváltott" tevékenységénél, ami addig éltette (mindenféle értelemben), és niche-ként tovább tudta vinni.

Nem válaszoltál a kérdésre, hanem tereltél.

Ne viccelj már! Azzal kezdtem a válaszomat, hogy "Fogalmam sincs". Nézd meg újra; ott van fent.

Szerkesztés (kiegészítés): vannak, akiknek jobb lett, mert kiszabadultak egy lélekölő munkából; a változás rákényszerítette őket arra, hogy más után nézzenek, és jobban jöttek ki belőle. És vannak, akiknek rosszabb lett, vagy mert az addigit szerették, vagy mert stabil megélhetés volt, stb. Röviden: "fogalmam sincs". 

Ne viccelj már! Azzal kezdtem a válaszomat, hogy "Fogalmam sincs". Nézd meg újra; ott van fent.

Aztán utána jött a bullshit.

Szerkesztés (kiegészítés): vannak, akiknek jobb lett, mert kiszabadultak egy lélekölő munkából; a változás rákényszerítette őket arra, hogy más után nézzenek, és jobban jöttek ki belőle. És vannak, akiknek rosszabb lett, vagy mert az addigit szerették, vagy mert stabil megélhetés volt, stb. Röviden: "fogalmam sincs". 

Miben más ez, hogy az AI felszabadít egy csomó embert egy lélekölő munkából?

(Az előbb megpróbáltam a hozzászólásomat kiegészíteni, de már nem sikerült, elveszett a módosítás, úgyhogy most leírom rövidebben, külön válaszban.)

Az én tézisem az, hogy a gyakorlatban nem mindegy, hogy konkrétan mely szintek között lépünk át absztrakcióval, hogy konkrétan mit gépesítünk. A gépesítéssel olyan folyamatokat tudunk kiváltani (pontosabban: elveszíteni), amelyek az emberi létet gazdagítják. Ha ilyen absztrakcióval a munka végzőjét megfosztjuk a Flow élménytől, akkor a munka végzője szegényebb lett.

A konkrét esetnél maradva: az előadó az ügyfélvisszajelzéseket érdemesnek találja arra, hogy a feldolgozásukat bármivel gépesítse és kiváltsa. Nyilván azért, mert ezt a munkafázist, folyamatot agyatlan, monoton nyűgnek érzi, amelynek végzése nem nyújt számára érzelmi jutalmat. Ez a baj.

A konkrét esetnél maradva: az előadó az ügyfélvisszajelzéseket érdemesnek találja arra, hogy a feldolgozásukat bármivel gépesítse és kiváltsa. Nyilván azért, mert ezt a munkafázist, folyamatot agyatlan, monoton nyűgnek érzi, amelynek végzése nem nyújt számára érzelmi jutalmat. Ez a baj.

Miért baj? Ez a tevékenység nagy mennyisében egy agyatlan és monoton nyűg. Ha neked kellene csinálni napi 8 órában, hogy ügyfél-visszajelzéseket olvasol, válaszolsz mindegyikre és statisztikát vezetsz róluk, akkor lehet, hogy te is így gondolnád. Azért nem így gondolod, mert van erről valami rózsaszín elképzelésed.

Mondok konkrét példát: amíg új volt az alkalmazásom, addig minden telepítésről kértem értesítést és minden review-ról kértem email-t. Mert volt hetente egy-egy. Amióta van naponta 50-100 telepítés és van napi 2-5 review, azóta nem kérek ilyen értesítést és bizony nyűg lett minden nap elolvasni 2-5 review-t és válaszolni rájuk. Az, hogy mikor lesz valami flow és mikor nyűg, az kurvára relatív.

van erről valami rózsaszín elképzelésed.

Nem annyira rózsaszín. Pl. programozási területen mit automatizálnak LLM-mel? Nagyon szűken kiragadva:

  • boilerplate kód előállítása
  • review-k
  • meglévő architektúra felderítése
  • dokumentáció feldolgozása, összegzése

Én ezeknek a feladatoknak mindegyikénél -- a saját munkámban -- haszontalannak és szegényítőnek tapasztaltam meg az LLM-et. Én szeretem megírni a boilerplate-et is saját magam, alaposan, aprólékosan; ha kell, csinálok hozzá generátort (akkor meg azt élvezem). A review-zásnak fontos szociális és tanító/tanuló vonatkozásai vannak; az arány / teher beállítása nagyon fontos, de kiváltani ezt a feladatot kontraproduktív (azok szeretik kiváltani, akik utálnak review-zni). Számomra kódot olvasni és apránként megérteni, illetve másik fejlesztőtől megtanulni sokkal nagyobb élmény, mint egy gépi összegzést elolvasni (ami vagy igaz, vagy nem). A dokumentáció terén pedig megtanultam, hogy sokkal jobban járok, ha az LLM-et csak egy fejlettebb keresőként használom, és az eredeti forrásokat magam elolvasom, ugyanis az összegzésben hihetetleneket csúsztat. Megbízhatóbb az eredeti forrás.

Az, hogy mikor lesz valami flow és mikor nyűg, az kurvára relatív.

Akkor ebben meg is egyezhetünk. Szemmel láthatóan teljesen más a véleményünk arról, hogy mi a vállalható nagyságrend / absztrakciós szint.

Én ezeknek a feladatoknak mindegyikénél -- a saját munkámban -- haszontalannak és szegényítőnek tapasztaltam meg az LLM-et.

Én meg ezek mindegyikénél hasznosnak találtam. A boilerplate kódot eddig is generáltam és elrejtettem, ha lehetett; a review sokat ad hozzá, főleg one-man-show esetén, ahol nincs még n kolléga, akik majd átnézik; a meglévő architektúra felderítésében is sokat segít például az IntelliJ IDEA új feature, hogy egy-egy kódblokk fölé kiírja, hogy szerinte az mit csinál az adott kontextusban; és abban is segít, hogy a dokumentációban megtaláljam azt a részt, ami számomra releváns.

Szemmel láthatóan teljesen más a véleményünk arról, hogy mi a vállalható nagyságrend / absztrakciós szint.

Oké, felteszek egy kérdést.

Android alkalmazást fejlesztesz, napi 8 órát szánsz az egészre, egyszerűsítsük le két tevékenységre:

a, felhasználói visszajelzéseket olvasol, válaszolsz meg, készítesz statisztikát, hogy milyen feature az, amiért akár pénzt is adnának és milyen hiba az, ami nagyon zavarja őket, majd ezekből készítesz issue/task, priorizálva, hogy melyikkel kell foglalkozni először,
b, az első pont eredményeképp fejleszted az alkalmazást.

Milyen a:b arány után kezdenéd úgy érezni, hogy nagyrészt egy kaptafára készült felhasználói visszajelzéseket olvasol vég nélkül, válaszolsz meg és készítesz róla statisztikát? 1:7? 4:4? 7:1? 8:0? Arról a teljesen szubjektív és relatív arányról beszélünk, amitől egy addig érdekes tevékenység hirtelen agyatlan, monoton nyűg lesz. Miért gondolod úgy, hogy te meg tudod mondani, hogy ez hol legyen? Én utálom, nekem a legjobb az lenne, ha 0:8 lenne ez, de mivel one-man-show az egész, nem lesz 0:8 soha, viszont tudok törekedni arra, hogy az (a,) tevékenység jelentősen kevesebb legyen, mint a (b,).

Android alkalmazást fejlesztesz

Nem ettem meszet :)

De értem, amit írsz. Hadd közelítsem most ezt meg felhasználói oldalról. Igénybe veszek egy szolgáltatást, vagy vásárolok egy terméket. Kapok egy felhívást, hogy értékeljem. Van az értékelési felületen egy szimpla skalár ("1-5 csillag"), meg egy szöveges mező.

Rögtön kezdjük azzal, hogy névtelenül nem lehet értékelni, amiből egyből következik, hogy profilozni fognak (és nyilván valamilyen értékelés-szolgáltatón keresztül történik a dolog, tehát egymáshoz nem köthető vásárlásaimból fognak személyes profilt építeni rólam). Ez rögtön elveszi a kedvem, hogy bármit is mondjak.

Ezen túllépve:

  • A számszerű pontozással nincs baj. Egy kattintás, semmi időmbe nem kerül, tudom, hogy majd bedobják az átlagszámításba / hisztogramba, rendben van.
  • A szöveges mezővel nagyon nagy baj van. Leülök (nem ülök le, de tegyük fel, a példa kedvéért), és írok egy 3-4 bekezdésből álló értékelést. Amit Te nem olvasol el, mert nyűg, agyatlan munka számodra. Nem törődsz az én véleményemmel, a véleményezésbe befektetett munkámmal; annyi érdekel a véleményemből, hogy többségi-e, vagy sem. Mi a csudának szánnék én arra időt, gondolatokat, hogy ilyen módon toljam a te szekeredet?

Fordítsuk meg. Felmegyek egy oldalra, ahol adott termék, szolgáltatás alatt van mondjuk 3000 szöveges vélemény. Ott miért nincs LLM, ami a következő vásárló számára összegezné, hogy ez a cég, szolgáltatás, termék milyen permanens problémákkal küzd?

A múltkor szállást foglaltam. 774 véleményből átolvastam 350+-t, egyesével; kizárólag a negatívumokra koncentrálva. Végül vállalhatónak találtam a szállást, viszont a "különleges kérések" rovatban kikötöttem, hogy a véleményekből leszűrt problémáktól mentesítsenek. Ott miért nem volt LLM?

Az az arány és nagyságrend, amit keresel, egyértelműen arra irányul, hogy a vásárlóból, felhasználóból a legtöbb hasznot húzd, a vásárlóra, felhasználóra való legkisebb ráfordítás mellett. Értem, hogy ez biznisz, meg értem, hogy eltérek a tárgytól (ez már fogyasztóvédelmi kérdés is talán). De számomra valahol itt értelmezhető az, hogy "vállalható nagyságrend". Mióta a Telekom bevezette Vandát, Vanda (tudtommal) közutálatnak örvend az ügyfelek körében.

Ugyanez vonatkozik a programozásra. Ha Te nem veszed a fáradtságot, hogy a kódodat megírd kézzel, vagy a hibabejelentést megírt kézzel, akkor én minek olvassam el reviewer-ként, vagy bug triage-ban? Ha nem olvasod el a visszajelzésemet vásárlóként, akkor minek írjam meg?

Ha utálsz felhasználói visszajelzéseket olvasni, miért nem írod oda az értékelő felületre, hogy "szöveges értékelésével nem foglalkozunk, legfeljebb statisztikai feldolgozásnak vetjük alá"? Azért nem írod oda, mert otthagynának a felhasználóid; bármilyen fogyasztóvédelmi témájú oldalon vagy fórumon körülnézel, mindig kiemelik, hogy ott kell vásárolni, ahol a tulajdonos / üzemeltető az egyedi panaszokra egyedi válaszokat ad. A mostani DPD botránynak is egyik központi eleme, hogy a DPD nem nyújtott -- jogszabályban megkövetelt -- érdemi ügyfélszolgálatot. Tehát a szöveges értékelő doboznak a lényege az átverés. Nem érdekel Téged a felhasználó, az érdekel, hogy kilóra detractor vagy promoter-e.

Ha nincs kedved felhasználói értékeléseket olvasni, akkor légy őszinte, és szüntesd meg a szöveges dobozt. Akkor a felhasználó egyértelműen tudja, hogy mennyit ér a visszajelzése számodra, és aztán nincs is mit LLM-be dobni.

Ez az üzleti skálázásnak a központi eleme: a növekedés azt jelenti, hogy

  • minden egyes felhasználó, vásárló kifizeti pontosan ugyanazt az árat (esetleg ha nagyban vásárol, akkor kap valamilyen egyedi, leszállított árat, de ez lényegi változást nem eredményez ebben a pontban),
  • viszont minden egyes felhasználó egyre kevesebb figyelmet, törődést kap -- ezt a saját példád is ékesen bizonyítja (eleinte elolvastál mindent, most meg már utálod).

Én olyan területen, ahol a felhasználókat -- a leírt módon -- tömegesen ki kell használni ahhoz, hogy a business fenntartható, kifizetődő legyen, egyszerűen nem vagyok hajlandó megjelenni a szolgáltatói, fejlesztői oldalon.

Az az arány és nagyságrend, amit keresel, egyértelműen arra irányul, hogy a vásárlóból, felhasználóból a legtöbb hasznot húzd, a vásárlóra, felhasználóra való legkisebb ráfordítás mellett.

Nem érted. Van egységnyi kapacitásod. Ez egy EV esetében mondjuk napi 8 óra. Ebből kellene valami hasznos végterméket produkálni. Vannak revenue generating és revenue enabling tevékenységek. Mindkettőre szükség van, de ha rosszul lövöd be az arányt, akkor nem lesz pénzed hó végén kajára. Ennyi.

Számomra ez annyit tesz, hogy a felhasználók kihasználása nélkül ez a tevékenység (EV keretek között) nem kifizetődő, nem fenntartható.

Mit értesz azon, hogy "felhasználók kihasználása"? Az, hogy géppel olvastatom el a visszajelzéseket?

Még mindig azt látom, hogy van valami romantikus elképzelésed, hogy minden, amit eddig gépesítettünk, az fasza és a világ előremozdítása, minden, amit ezek után gépesítünk, az meg az ördögtől való.

Szerintem egyszerűen megöregedtél.

Mit értesz azon, hogy "felhasználók kihasználása"? Az, hogy géppel olvastatom el a visszajelzéseket?

Igen! A visszajelzési felület (feltehetően) azt sugallja, hogy érdemben foglalkoznak a fejlesztők az egyedi visszajelzésekkel, miközben valójában csak tömeges kommentelemzés folyik.

minden, amit eddig gépesítettünk, az fasza és a világ előremozdítása

A legkevésbé sem gondolom ezt. Ahogy írom máshol is, több területen is igyekszem a gépesített / tömegtermeléstől távol tartani magam (vásárlói oldalon), és inkább őstermelőtől, kisiparostól szerzek be dolgokat.

minden, amit ezek után gépesítünk, az meg az ördögtől való

Ezt sem így gondolom; például az útépítést, útjavítást, közművesítést sokkal inkább gépesíteni kellene, hogy a minősége jobb, egyenletesebb legyen.

Szerintem egyszerűen megöregedtél.

Ez vitathatatlan, de én itt nem érzem lényegesnek. Az idevágó személyiségi jegyeim gyerekkorom óta megvannak.

Mit értesz azon, hogy "felhasználók kihasználása"? Az, hogy géppel olvastatom el a visszajelzéseket?

Igen! A visszajelzési felület (feltehetően) azt sugallja, hogy érdemben foglalkoznak a fejlesztők az egyedi visszajelzésekkel, miközben valójában csak tömeges kommentelemzés folyik.

Én érdemben foglalkozok a visszajelzésekkel.

Ahogy írom máshol is, több területen is igyekszem a gépesített / tömegtermeléstől távol tartani magam (vásárlói oldalon), és inkább őstermelőtől, kisiparostól szerzek be dolgokat.

A kisiparos is gépeket használ, sőt, az őstermelő is. Nincs megfizethető kézi termelés már több évtizede. Ha azt hiszed, hogy van, akkor hagytad magad átvágni.

Ezt sem így gondolom; például az útépítést, útjavítást, közművesítést sokkal inkább gépesíteni kellene, hogy a minősége jobb, egyenletesebb legyen.

Na, de miért nem vered az asztalt, hogy legyen kézműves az útépítés? Miben másabb, mint egy mobilalkalmazás?

Ez vitathatatlan, de én itt nem érzem lényegesnek. Az idevágó személyiségi jegyeim gyerekkorom óta megvannak.

Áh, tehát nincs mosógéped, mosogatógéped, autód, önmagát vezérlő fűtésed, mobiltelefonod, interneted, és a többi? Vagy mindez van, csak egészen az utóbb évekig ez természetesnek tűnt?

Na, de miért nem vered az asztalt, hogy legyen kézműves az útépítés? Miben másabb, mint egy mobilalkalmazás?

Jó kérdés! Két okot vélek találni:

  • Útépítő munkásokon még nem láttam, hogy szenvedéllyel, nagyon motiváltan végezték volna a munkájukat. Nem találnak örömet a munka végzésében, így nem veszítenek (érzelmileg), ha a munkát gép végzi helyettük.
  • Az a benyomásom (használói oldalról), hogy a kézzel végzett munka minősége ezen a téren rosszabb, mint a gépesítetté.

De miért gondolod, hogy az alkalmazásfejlesztés az nem olyan, mint az útépítés? Az elmúlt 30 év alatt az alkalmazásfejlesztés folyamatában egy csomó gépesítés történt, töredékét kell ma csinálnod ugyanannyi eredményhez, mint 30 éve kellett. Én kurvára örülök, hogy egyre több nyűgöt levesz a vállamról a gépesítés, te valamiért úgy gondolod, hogy minden automatizálás és gépesítés az alkalmazásfejlesztés területén mind jó volt egészen a közelmúltig, aztán azóta nem. Biztos, hogy objektív okaid vannak?

te valamiért úgy gondolod, hogy minden automatizálás és gépesítés az alkalmazásfejlesztés területén mind jó volt egészen a közelmúltig

Egyáltalán nem gondolom így.

  1. Arról a részéről, ami azelőtt történt, hogy én magam belekezdtem volna, kb. 40 évvel ezelőtt, nem nagyon van véleményem, se pozitív, se negatív.
  2. Ami azóta történt (tehát nem csak az elmúlt 5 évben, hanem az elmúlt 40-ben), az számomra nagyon is ambivalens, vegyesfelvágott.

Biztos, hogy objektív okaid vannak?

Biztos, hogy nem objektív okaim vannak. Ugyan miért kellene ezt a kérdést csak objektíven megítélni? Az összes hozzászólásomból láthatod, hogy érzelmi, önmegvalósítási, fogyasztóvédelmi oldalról közelítem meg a témát. (Egyébként nálad is van érzelmi oldal, vö. "kurvára örülök, hogy", csak éppen ellentétes előjellel.) Pont ez a lényeg: én nem redukálom kizárólag termelékenységi szempontokra.

Az ember a saját élete vonulatában tud leginkább megítélni dolgokat. Nem archeológus vagyok, hanem gyakorlati dolgozó. Nem azon ítélkezem, ami a kezdésem előtt változott, hanem azokon az átmeneteken, változásokon, amiket megéltem. Nagyon sokan érzik úgy, hogy (érzelmi oldalról) a fénykor a 80-as, 90-es években volt, és ezt kizárólag azzal magyarázni, hogy "mind begyöpösödött vén faszok vagytok", tévedés. Én egyetemista koromban is bőségesen utasítottam el változásokat, akkor új technológiákat stb.

Biztos, hogy nem objektív okaim vannak.

Pedig próbáltad igencsak objektív dolgokkal alátámasztani. Akkor mondd ki, hogy szubjektív okaid vannak és akkor nincs min rágódni. Nem tetszik, ez van, de akkor ne akarj szubjektív véleményből extrapolálni, hogy a világnak hogy kellene működnie.

Nagyon sokan érzik úgy, hogy (érzelmi oldalról) a fénykor a 80-as, 90-es években volt, és ezt kizárólag azzal magyarázni, hogy "mind begyöpösödött vén faszok vagytok", tévedés.

Nézd, azok, akik szerint a '80-as '90-es évek volt a fénykor, azok bizony vén faszok, nem igazán fogsz találni olyan mostani huszonévest, aki ezt mondaná. Ha pedig megkérdeztél volna a '80-as években egy akkori 50-60 évest, az meg azt mondaná, hogy a '60-as évek voltak a fénykor, azóta minden hanyatlik, a '60-as években meg ugyanez a korosztály a '40-es éveket mondaná. Szerintem ki tudod algoritmizálni, hogy mi a közös, a pszichológia "rosy retrospection" néven hivatkozza a jelenséget...

Nézd, azok, akik szerint a '80-as '90-es évek volt a fénykor, azok bizony vén faszok

Annyival pontosítanék (az eredeti hozzászólásom nem volt elég részletes), hogy "informatikai fénykor".

rosy retrospection

Igen és nem. Felcsapom a youtube-ot. Hallok olyan számokat 20, 30 évvel ezelőttről, amelyeket még sosem hallottam, és hallok olyanokat, amelyek pár évesek, és szintén sosem hallottam. Nem (csak) arról van szó, hogy az előbbi tetszik, az utóbbi meg nem teszik. Az előbbi mély, meg kell érte küzdeni, tanult ízlés. Az utóbbi fülbemászó, felszínes gagyi.

Filmekre is igaz. Kifejezetten szeretek 1940-1970 között készült filmeket nézni. Ha összevetem azokat a mai nagy sikerekkel, többnyire a régebbieket jobban élvezem.

A szándékos silányítás, "optimalizálás", kispórolás nem tagadható.

Na ez így ebben a formában eléggé téves. Zenei szempontból egyrészt a 60-as, 70-es években is rengeteg gagyi volt, annak idején sok zenét vettem fel magnóra (természetesen ez már torzítás, mert ami nem tetszett, nem vettem fel, tehát itt kihullott a férgese (legalábbis az általam férgesnek tartott része). Amit felvettem, azok szinte mind megvannak (pár kazetta költözéskor elkeveredett, de lényegtelen), ezeket időnként most is meg szoktam hallgatni, ahogy a szalagos felvételeket is. Egy csomó olyan van köztük, amelyeket ma már biztos nem vennék fel, mert egyszerűen felszínes, gagyi. Pedig ez már a válogatott része volt az akkorinak. Persze az is közrejátszik, hogy jelenleg sokkal több zene jut el az előadótól, ezek jó része annak idején nem jutott volna át a küszöbön Régi történet, Mike Oldfieldnek komolyan meg kellett küzdenie, hogy találjon kiadót a Tubular Bellsre, de említhetném kedvenc zenekaromat (Solaris), akik aktív idejükben összesen egy lemezlehetőséget kaptak. Most ez egy előadó számára sokkal könnyebb.

A film érdekes kérdés, történetről inkább a látványra helyezték át a hangsúlyt, ez általában nem tesz jót az élvezhetőségnek (játékok dettó).

Vannak egyéni eltérések, de a statisztika az statisztika: https://imgur.com/a/J5hvMxQ

A szándékos silányítás, "optimalizálás", kispórolás nem tagadható.

3000 éve, amióta írásos emlékeink vannak, ezt mondják az idősek arra, ami újdonság. Szóval minimum 3000 éve hanyatlunk? Really?

3000 éve, amióta írásos emlékeink vannak, ezt mondják az idősek arra, ami újdonság.

Igen.

Szóval minimum 3000 éve hanyatlunk? Really?

  1. Nem "szóval". Nem a fentiből következik:
  2. de igen, van, amiben igen. Bizonyos területeken sokkal régebb óta, mint írod. Nem fogok idecitálni távolabb eső témákat, forrásokat, mert nem érnék el vele semmit; de igen.

Az az arány és nagyságrend, amit keresel, egyértelműen arra irányul, hogy a vásárlóból, felhasználóból a legtöbb hasznot húzd, a vásárlóra, felhasználóra való legkisebb ráfordítás mellett.

Mi más lenne a célom? Mi más lenne egy cég célja? Te miből veszed a kenyeret a boltban? A boltnak nem érdeke, hogy a lehető legdrágábban adja a kenyeret, a legkisebb ráfordítás mellett?

Ha utálsz felhasználói visszajelzéseket olvasni, miért nem írod oda az értékelő felületre, hogy "szöveges értékelésével nem foglalkozunk, legfeljebb statisztikai feldolgozásnak vetjük alá"?

Mert ugyanúgy foglalkozok a szöveges értékeléssel és ugyanúgy statisztikai feldolgozásnak vetem alá, csak nem a vacsa-vacsa kezecskéimmel teszem, hanem - kapaszkodj meg: egy gépet használok rá. A vége ugyanaz a folyamatnak, csak amíg az egyik esetben mondjuk elbaszok napi 2 órát azzal, hogy a vacsa-vacsa kezecskéimmal fogjam meg és a csecse-becse szemecskéimmel olvassak el minden egyes értékelést, addig ezt a 2 órát arra tudom használni, hogy 33 százalékkal több bugot javítok ki vagy 33 százalékkal több feature kerül az alkalmazásba. És ez jobb a felhasználóknak, mintha odaírnám, hogy kézműves módszerekkel fejlesztem az alkalmazást.

A felhasználói visszajelzések feldolgozását mindenképp meg kell tenni, mindegy, hogy én baszok el rá 2 órát naponta, felbérlek egy asszisztenst, aki napi két órát dolgozik ezzel vagy felbérlek egy virtuális asszisztenst, vagy felbérlek erre egy LLM modellt, hogy a végén essen ki egy statisztika, hogy mi fáj a felhasználóknak és ebből készítsen érthető specifikációval fejlesztési feladatokat. Ha a vége ugyanaz és az egyik módszer havonta 300-600 ezer forintba kerül, a másik meg ~5000 forintba, akkor miért válasszak kézműves módszert?

Nálad ott megy félre valahol a dolog, hogy szeretnéd, hogy "kézműves" legyen ez a folyamat, mert egy olyan világba születtél bele és nőttél fel, ahol egy csomó dolog automatizálva van gépekkel, de ez kézműves volt eddig, mert nem voltak jó gépeink szövegfeldolgozásra és szövegírásra. Az autódban még kézzel állítod a gyújtásszöget és a hideg motornál a dús keveréket vagy ott már elfogadtad, hogy lélektelen automata csinálja mindezt?

Én olyan területen, ahol a felhasználókat -- a leírt módon -- tömegesen ki kell használni ahhoz, hogy a business fenntartható, kifizetődő legyen, egyszerűen nem vagyok hajlandó megjelenni a szolgáltatói, fejlesztői oldalon.

Miért érzed úgy, hogy ez a felhasználók tömeges kihasználása? Ez az én időm hasznosabb beosztása, aminek eredményeképp a felhasználóknak is jobb.

Ha nincs kedved felhasználói értékeléseket olvasni, akkor légy őszinte, és szüntesd meg a szöveges dobozt. Akkor a felhasználó egyértelműen tudja, hogy mennyit ér a visszajelzése számodra, és aztán nincs is mit LLM-be dobni.

De nekem számít a visszajelzés, csak nem akarom mindegyiket egyesével elolvasni. Miben másabb ez, mintha kiadnám mondjuk egy random indiainak?

Mi más lenne egy cég célja?

Itt már világnézeti különbségeknél tartunk; a fentire ezért szándékosan nem reagálok.

És ez jobb a felhasználóknak, mintha odaírnám, hogy kézműves módszerekkel fejlesztem az alkalmazást.

Értem, elfogadom, hogy a Te esetedben ez így van. Én nem értek vele egyet.

Ha a vége ugyanaz és az egyik módszer havonta 300-600 ezer forintba kerül, a másik meg ~5000 forintba, akkor miért válasszak kézműves módszert?

Az én véleményem szerint a felhasználói élmény messze nem ugyanaz. Nekem számít, hogy érdemi beszélgetésre méltat-e a fejlesztő, vagy sem, ha már vettem a fáradságot, és részletes véleményt írtam.

A "kézműves" jelző nagyon találó, magam is használom, csak nem mertem a beszélgetésbe behozni eddig. Rendszeresen vásárolok kézműves terméket, több szektorban is (ha a "szektor" itt megfelelő kifejezés).

szeretnéd, hogy "kézműves" legyen ez a folyamat

Igen.

mert egy olyan világba születtél bele és nőttél fel, ahol egy csomó dolog automatizálva van gépekkel, de ez kézműves volt eddig

Szerintem nem ezért (vagyis nem pusztán a hagyományoshoz, megszokotthoz ragaszokdás miatt). Hanem azért, mert nekem a kézműves termelés (termelői oldalról) sokkal többet nyújt (jobban jutalmaz érzelmileg), mint a tömegtermelés, miközben anyagilag nem rosszabb. Illetve azért is, mert a kézműves termék (fogyasztói oldalról) számomra mind érzelmileg, mind minőségben lényegesen többet nyújt (ahogy említem, több szektorban is), mint a tömegtermék; akkor is, ha többe kerül.

Az autódban még kézzel állítod a gyújtásszöget és a hideg motornál a dús keveréket vagy ott már elfogadtad, hogy lélektelen automata csinálja mindezt?

Tele van az internet azzal, hogy az autókban:

  • túl sok a szoftver, az integráció, és az ebből fakadó meghibásodások, használhatatlanság, bonyolultság,
  • a "subscription model" elviselhetetlen, mert az autó már nem a tulajdonost szolgálja, hanem a gyártót,
  • a kezelőfelületek egyre rosszabbak (nincsenek gombok, amelyeket ránézés nélkül is ki lehet tapintani),
  • az anyagminőséget, tartósságot folyamatosan rontják, "optimalizálják".

A saját kocsim 19 éves, nullásan vettem szalonból, 315K km van benne, rendszeresen szervizeltetem, még lehet benne izzót cserélni kézzel. Vezettem modernebb autókat (csereautókban, jellemzően); eszem ágában sincs lecserélni a sajátomat. Borzasztó az újakat vezetni.

Ez az én időm hasznosabb beosztása,

Igen.

 aminek eredményeképp a felhasználóknak is jobb.

Ez az, amiben nem értünk egyet (mondom ezt én, mint potenciális felhasználó).

De nekem számít a visszajelzés, csak nem akarom mindegyiket egyesével elolvasni.

Tehát kilóra számít a visszajelzés.

 Miben másabb ez, mintha kiadnám mondjuk egy random indiainak?

Nem is azt javasolnám, hogy egy random indiai dolgozza fel a visszajelzéseket.

Mi más lenne egy cég célja?

Itt már világnézeti különbségeknél tartunk; a fentire ezért szándékosan nem reagálok.

Bocsánat, nem tudtam, hogy ingyen dolgozol egy kommunában...

Az én véleményem szerint a felhasználói élmény messze nem ugyanaz. Nekem számít, hogy érdemi beszélgetésre méltat-e a fejlesztő, vagy sem, ha már vettem a fáradságot, és részletes véleményt írtam.

Te mennyi felhasználóval beszéltél azokkal az alkalmazásokkal kapcsolatban, amelyeken dolgoztál? Mennyi véleményt olvastál el? Mennyi véleményre válaszoltál?

Szerintem nem ezért (vagyis nem pusztán a hagyományoshoz, megszokotthoz ragaszokdás miatt). Hanem azért, mert nekem a kézműves termelés (termelői oldalról) sokkal többet nyújt (jobban jutalmaz érzelmileg), mint a tömegtermelés, miközben anyagilag nem rosszabb. Illetve azért is, mert a kézműves termék (fogyasztói oldalról) számomra mind érzelmileg, mind minőségben lényegesen többet nyújt (ahogy említem, több szektorban is), mint a tömegtermék; akkor is, ha többe kerül.

De ugyanakkor tömegtermelt termékeket használsz azokból a dolgokból, amik már voltak, amikor megszülettél vagy akkor kerültek piacra, amikor felnőtt lettél. A leírásod alapján minden automatizációt, újdonságot, robotikát, egyebet elfogadtál kb. zokszó nélkül, kb. 10-15 évvel ezelőttig. Aztán megöregedtél és képtelen vagy befogadni az újabb dolgokat. Gondolom a laptopod nem kézműves. A mosógéped nem kézműves. A hűtőd nem kézműves. Az autód se kézműves.

Egyébként a "kézműves" jelző egy marketing eszköz, a pécsi sörfőzde például kézműves sörfőzde, minden automatizált benne, akkor automatizálták, amikor ugyanabban az utcába jártam középiskolában vezérlés- és irányítástechnikusi papírért, és a sörgyárba jártunk szakmai képzésre. Kézműves az, amit otthon megtermelsz gépek nélkül, minden más már többé-kevésbé automatizált vagy gépeket használnak. A luxustermékeknél van még valamennyi valódi kézművesség, de szerintem nem azokra gondolsz.

Tehát kilóra számít a visszajelzés.

Nem, az számít, ami benne van. Az érdekel, hogy milyen bugok vannak és milyen feature hiányzik. Te amúgy kézműves terméket gyártasz a munkahelyeden? Vagy 632. melós vagy a nagy szalag mellett, akinek a termék egy kis tört részében van benne a keze nyoma és az is sok gépesített folyamaton keresztül?

Nem is azt javasolnám, hogy egy random indiai dolgozza fel a visszajelzéseket.

Hát akkor? Mivel jobb egy random magyar egy nemzetközi alkalmazásnál?

Te mennyi felhasználóval beszéltél azokkal az alkalmazásokkal kapcsolatban, amelyeken dolgoztál? Mennyi véleményt olvastál el? Mennyi véleményre válaszoltál?

Az upstream bug tracker-ben és az upstream levlistákon minden egyes felhasználói kérdéssel foglalkoztam, amely az én alrendszeremet érintette; gyakran olyanokkal is, amelyek nem érintették azt.

A downstream tracker-ben relatíve ritkán fordult elő ügyfél (vagy partner) közvetlenül. Több rétegben volt support, nem minden ticket-hez tartozott ügyfél, és nem minden ügyfélkérés jutott le a bug tracker-ig. Minden buggal érdemben foglalkoztam; ha ügyféllel vagy partnerral volt kapcsolatos, akkor a buggal való foglalkozás a velük való eszmecserére is kiterjedt.

Nyilván teljesen más volt az üzleti modell (és az én kompenzációm szerkezete), mint a tiéd.

Nem gondoltam egyébként, hogy ezen ennyit fogunk pörögni. Felhasználói szempontból én annyit várnék el, hogy ha nem feltétlenül olvassa el a konkrét szöveges visszajelzésemet egy ember, akkor ezt az eshetőséget tüntessék fel a comment box mellett. És akkor nem fogok kommentelni.

(Egyébként tanulságos számomra ez a szál; megértettem, hogy ma már lényegében minden szöveges visszajelzést, ami nem hivatalos panasz, gépesítve olvasnak el, és egyedi választ nem várhatok rá; így ilyenek írásától ezentúl el is tekintek.)

Az upstream bug tracker-ben és az upstream levlistákon minden egyes felhasználói kérdéssel foglalkoztam, amely az én alrendszeremet érintette; gyakran olyanokkal is, amelyek nem érintették azt.

És ez mennyi idődet vitte el naponta? Ha a napi 8 órádból 4 órát elvisz, akkor is csinálnád? Ha 7 órát elvisz, akkor is? Hol van nálad a határ?

Felhasználói szempontból én annyit várnék el, hogy ha nem feltétlenül olvassa el a konkrét szöveges visszajelzésemet egy ember, akkor ezt az eshetőséget tüntessék fel a comment box mellett. És akkor nem fogok kommentelni.

Ez szimplán luddizmus 4.0.

(Egyébként tanulságos számomra ez a szál; megértettem, hogy ma már lényegében minden szöveges visszajelzést, ami nem hivatalos panasz, gépesítve olvasnak el, és egyedi választ nem várhatok rá; így ilyenek írásától ezentúl el is tekintek.)

De közben te is ezt teszed sok más területen, a cégnél a techwriter teljesen jogosan mondhatná ugyanezen elvek mentén, hogy lófaszt olvastassátok el a több tucat egyenként több száz vagy több ezer oldalas doksit AI keresővel, sőt, legyen csak kinyomtatva papíron, abszolút kereshetetlen formában, aztán üljetek le szépen a seggetekre és olvassátok el, tanuljátok meg cover-to-cover, hogy mi hol van benne. Lófaszt legyen beolvasva és beindexelve, olvassa el mindenki saját szeműleg. Ez miben más? Jogos lenne a techwriter sértődése, ha bármilyen gép dolgozza fel a doksihalmazt, hogy kereshető legyen? Horribile dictu, AI önti könnyebben feldolgozható formába? Mert lehet használni arra az AI-t, hogy hozza ki a két tucat különböző doksiból az adott feature minden szükséges specifikációját és akkor elég azt használni a fejlesztéshez. Ez nem veszi el a doksiírás érzelmi bevonottságát?

Te szerintem ezt nem gondoltad végig, leereszkedett a vörös köd a szemed elé, hogy nem ember olvassa el a review-t.

És ez mennyi idődet vitte el naponta? Ha a napi 8 órádból 4 órát elvisz, akkor is csinálnád? Ha 7 órát elvisz, akkor is? Hol van nálad a határ?

Mint upstream co-maintainer-nek: rengeteget. A munkámnak egy hivatalos része volt, élveztem, és megfizettek érte. A határ ott volt, amikor már elfáradtam a folyamatos interakcióban, vagy valakivel nem jutottam dűlőre, vagy nem maradt időm (vagy inkább: energiám) fejleszteni (ami szintén belső motiváció volt).

Lófaszt legyen beolvasva és beindexelve, olvassa el mindenki saját szeműleg. Ez miben más?

Abban más, hogy én a segédeszközöket navigációra használom, de aztán elolvasom az eredetit is. A navigáció az eredeti dokumentum felhasználásának a szolgálatában áll. Ugyanúgy, ahogy a meggondoltan kialakított dokumentumszerkezet, tartalomjegyzék, tárgymutató, bibliográfia.

Egy példa: az előző céges mailbox-omban évek alatt több százezer email gyűlt össze (sohasem törlök semmit, és nincsenek feldolgozatlan leveleim). Az email-eket a gépemen futó helyi imap szerverre (Dovecot) tükröztem, és helyileg indexeltem (recoll). Rendkívül hatékonyan találtam meg akár 5-8 évvel korábbi email-eket is. A keresés kimenete végül mindig egy Message-Id volt, amit aztán Thunderbird-ben megnyitottam, és az eredetit olvastam el. Ez gyökeresen eltér attól, hogy egy gép megemészti az eredetit (vagy esetleg az egész szálat), és én egy kivonatot olvasok el. Olyan kijelentésekkel, amelyeket soha senki nem tett meg, de minimum olyan fogalmazással, amit soha senki nem írt le.

Ez miben más? Jogos lenne a techwriter sértődése, ha bármilyen gép dolgozza fel a doksihalmazt, hogy kereshető legyen?

Nem, mert végül az eredetit olvasom el.

Horribile dictu, AI önti könnyebben feldolgozható formába?

Ezzel az eredeti alkotás sava-borsa veszik el.

Sarkítok, de:

  • Miért nem AI-jal összegezve olvasunk regényeket, verseket?
  • Miért nem AI-jal összegezve hallgatunk zeneműveket (akár klasszikusat, akár populárist)?
  • Miért nem AI által kivonatolva nézünk meg filmeket, színházi darabokat, szobrokat?
  • Miért nem AI-jal írják a kortárs költők a verseiket?

Neked annyi számít, hogy az AI segítségével a lehető legkisebb energiabefektetéssel szívd ki az összes, gyakorlati információt az adott forrásból. Nekem nem ez számít. A hatékonyság is számít, valóban, de nem csak (talán nem is elsősorban) az számít.

Mondhatod, hogy egy műszaki specifikációnak nincs művészeti értéke, kizárólag az információtartalma számít. Mondhatod ugyanezt egy forráskódra is. Mondhatod ugyanezt az app store-ban az app alá beírt 4-5 soros kommentre is, esetleg itt a hupos kommentekre is. Elfogadom, ha ezt gondolod; én nem értek egyet egyik (feltételezett) kijelentéssel sem ezek közül, sem fogyasztói, sem előállítói oldalon. Művészeti értéket nem feltétlenül rendelnék ezekhez a kifejezési formákhoz, valóban, viszont azt vallom, hogy mindegyik több, mint a nyers információtartalma.

Mert lehet használni arra az AI-t, hogy hozza ki a két tucat különböző doksiból az adott feature minden szükséges specifikációját és akkor elég azt használni a fejlesztéshez. Ez nem veszi el a doksiírás érzelmi bevonottságát?

Dehogynem, pont ezt mondom. (Bocsáss meg, most nem értelek; az utolsó kérdésed mintha az én álláspontomat erősítené.)

Te szerintem ezt nem gondoltad végig,

Ez nem lehetetlen, de most legalább gondolkozunk rajta :)

leereszkedett a vörös köd a szemed elé, hogy nem ember olvassa el a review-t.

A vörös köd azért túlzás. Méltatlannak érzem, az biztos.

Mint upstream co-maintainer-nek: rengeteget. A munkámnak egy hivatalos része volt, élveztem, és megfizettek érte. A határ ott volt, amikor már elfáradtam a folyamatos interakcióban, vagy valakivel nem jutottam dűlőre, vagy nem maradt időm (vagy inkább: energiám) fejleszteni (ami szintén belső motiváció volt).

Egyrészt, hol a határ? Ezt még mindig nem válaszoltad meg, nem tudjuk. Másrészt, ha a munkaköröd 8 óra fejlesztés naponta, akkor ebből mennyit áldozol be arra, hogy ügyfeleket olvass és válaszolj a kérdésekre fórumokban és akár telefonon? Egyébként minden fejlesztőnek el kellene olvasnia az ügyfelek visszajelzéseit?

Abban más, hogy én a segédeszközöket navigációra használom, de aztán elolvasom az eredetit is. A navigáció az eredeti dokumentum felhasználásának a szolgálatában áll. Ugyanúgy, ahogy a meggondoltan kialakított dokumentumszerkezet, tartalomjegyzék, tárgymutató, bibliográfia.

Ja, tehát az indexelés az más? Pedig ugyanúgy arra támaszkodsz, hogy valaki más elolvasta a szöveghalmazt és ha rákérdezel, hogy ez-és-ez hol van benne, akkor megmondja több-kevesebb sikerrel. Ha valamit nem jól ért a kereső, akkor nem találod meg, mert te nem olvastad el, te csak azt használod, amit visszaadott. Még mindig nem értem, hogy hol van a lényegi különbség az LLM és egy grep között.

Egy példa: az előző céges mailbox-omban évek alatt több százezer email gyűlt össze (sohasem törlök semmit, és nincsenek feldolgozatlan leveleim). Az email-eket a gépemen futó helyi imap szerverre (Dovecot) tükröztem, és helyileg indexeltem (recoll). Rendkívül hatékonyan találtam meg akár 5-8 évvel korábbi email-eket is. A keresés kimenete végül mindig egy Message-Id volt, amit aztán Thunderbird-ben megnyitottam, és az eredetit olvastam el. Ez gyökeresen eltér attól, hogy egy gép megemészti az eredetit (vagy esetleg az egész szálat), és én egy kivonatot olvasok el. Olyan kijelentésekkel, amelyeket soha senki nem tett meg, de minimum olyan fogalmazással, amit soha senki nem írt le.

Lófaszt tér el gyökeresen. Arra támaszkodsz, hogy valaki más - egy gép - elolvassa az összes leveled és ha neked kell valami belőle, akkor megkeresi. Ha nem találja meg, akkor te se fogod, mert ugye nem olvastad el azokat a leveleket, amelyeket nem talált meg. Ugyanúgy egy gépre támaszkodsz, csak ez a gép egyszerűbb és másképp hibázik és már hozzászoktál 30 év alatt, aztán most jön egy másik gép.

Ezzel az eredeti alkotás sava-borsa veszik el.

Lófaszt már, nem műalkotást készítünk, hanem terméket. Az ügyfeleket nem érdekli, hogy mennyi részét készítette robot, automata vagy gép, az érdekli, hogy a problémáját, amivel küszködik, azt megoldja-e és mennyiért oldja meg.

Neked annyi számít, hogy az AI segítségével a lehető legkisebb energiabefektetéssel szívd ki az összes, gyakorlati információt az adott forrásból. Nekem nem ez számít. A hatékonyság is számít, valóban, de nem csak (talán nem is elsősorban) az számít.

Neked is számít. Csak nem LLM keres a levelezésedben, hanem egy regex. Ha nem számítana a hatékonyság, akkor nem programmal keresnél a leveleidben, nem keresővel keresnél a dokumentációban. Az LLM egy eszköz. Ugyanolyan eszköz, mint a grep, az awk vagy a Thunderbird, vagy bármi egyéb.

A vörös köd azért túlzás. Méltatlannak érzem, az biztos.

Akik ebbe beleszületnek és most huszonévesek, mint te a '80-as és '90-es években, azoknak ez teljesen természetes része lesz az életnek, mint ahogy neked is teljesen természetes részei az életednek azok a paradigmát váltó eszközök, amelyek a '80-as és '90-es években jöttek ki. Csak akkor te voltál fiatal, most meg azok fiatalok, akkor 2000 körül születtek. Ugyanez a minta ismétlődik évszázadokon keresztül.

Egyrészt, hol a határ? Ezt még mindig nem válaszoltad meg, nem tudjuk.

Nincs rá számszerű definícióm. Érzésből tolom, gyakran túlhajszolom magam.

Másrészt, ha a munkaköröd 8 óra fejlesztés naponta, akkor ebből mennyit áldozol be arra, hogy ügyfeleket olvass és válaszolj a kérdésekre fórumokban

Hát azt a 8 órát mondjuk úgy, hogy "nominális" nyolc óra; volt az a valóságban 12, időnként 14 is (rendszeresen, nem kivételesen), és ez nem kényszer vagy anyagi motiváció volt, hanem belső motiváció. (Szerencsére anyagilag is megtérült.)

A priorizálás számomra mindig nehéz, az alap hozzáállásom az, hogy "csináljunk meg mindent". Ez nyilván nem működik (objektíven nem fér bele az időbe), de szerencsére a szervezetben van olyan ember, akinek pontosan ez (is) a feladata, hogy ilyen kérdésekben segítsen, döntsön. Azóta ezen a téren fejlődtem azért; most már van életem.

és akár telefonon?

Ki van zárva. Nulla perc. Teljes mértékben aszinkron kommunikációval dolgoztam, latencia helyett sávszélességre gyúrtam. (Az utóbbi időben ez is enyhült, most már tudom értékelni a Slack-et is.)

Egyébként minden fejlesztőnek el kellene olvasnia az ügyfelek visszajelzéseit?

Erről nem tudok nyilatkozni; az én területemen lényegében egyedül voltam, így az "összes" és "csak egy" ugyanazt jelentette.

Még mindig nem értem, hogy hol van a lényegi különbség az LLM és egy grep között.

Ha az LLM használatát le tudom szűkíteni eredeti források fellelésére, akkor arra nyugodtan használom. Arra nagyon jó is tud lenni (egész addig, amíg csak pointereket ad).

A lényegi különbség a generálásnál mutatkozik meg. A grep, a mailbox-om indexelése visszaad valamit, amit egy ember egyszer megírt. Amit olvasok, az emberi kimenet. Az LLM összegzése nem érdekel, egyrészt mert gyakran döbbenetesen -- és közben nagyon bátran, nagy mellénnyel -- téves, másrészt pedig mert nem ember írta.

Ha nem találja meg, akkor te se fogod, mert ugye nem olvastad el azokat a leveleket, amelyeket nem talált meg.

Ez így van!

Ugyanúgy egy gépre támaszkodsz, csak ez a gép egyszerűbb és másképp hibázik

Ezt is jól látod, sőt, még azt is hozzáteszem, hogy amikor viszont sikeres, akkor szintén másképpen sikeres. Hamis pozitívot nem akarok olvasni (= generátumot, amit nem ember írt meg; akkor sem, ha a nyers információtartalma nagyjából jó). Az indexelésnél ez van:

  1. tévedés: nem találja meg. Rendben, nem olvasom el.
  2. tévedés: talál valamit, de nem igazán jó. Vagy elolvasom, vagy nem olvasom el, de ha elolvasom is, akkor is emberi alkotást olvastam.
  3. megtalálja, amit kerestem: hurrá, elolvasom az eredetit.

Az LLM viselkedéseinek halmaza tartalmazza az összes fentit, viszont tud még így is tévedni:

  1. generál valamit, aminek köze sincs a valósághoz. Katasztrófa.
  2. generál valamit, ami jól-rosszul leírja a valóságot, de nem embertől származik.

Én ez utóbbi kettőből egyiket sem akarom elolvasni; számomra mind a kettő hamis pozitív.

nem műalkotást készítünk, hanem terméket

Ezzel igazából le is zárhatnánk a beszélgetést. Nem értünk egyet. Én nem termékfejlesztésért nyúzom a gépet 40 éve. Azt sem hanyagolom el, nagyon gondosan elvégzem, amit vállaltam, de nem azért vagyok benne. Másodlagos. Azért vagyok benne, mert Flow élményt ad, mert a testnyílásaimon tocsog ki a dopamin, miközben hibára vadászok, dokumentálok, vagy kódot írok, vagy review közben magyarázok.

Az ügyfeleket nem érdekli, hogy mennyi részét készítette robot, automata vagy gép, az érdekli, hogy a problémáját, amivel küszködik, azt megoldja-e és mennyiért oldja meg.

Stimmel! Az ügyfelek legnagyobb része ilyen, ezt nem vitatom. Ettől még az én motivációm lehet más, ha -- mintegy másodlagosan -- őnekik is a kedvükre teszek. Mint kiderült, az elkötelezettség, hivatástudat, átszellemültség stb. korrelál a minőséggel. És azért van pár olyan ügyfél is, akit érdekelnek olyan szempontok is, amelyek a legtöbb ügyfelet nem.

Igen, olvastam itt sokszor a hupon, hogy egyik-másik hupper kollégát a főnöke leállította azzal, hogy "na ezt már hagyjad, ennél jobb nem kell, ezt a minőséget senki nem fizeti meg nekünk". Én ilyen helyen egyetlen hetet sem tudnék dolgozni. Szerencsére nem csak ilyen helyek léteznek. (Ismét: "kézművesség".)

Figyelj, én vágom, hogy amit én szeretek, az egy niche. Nem baj, hogy az!

Csak nem LLM keres a levelezésedben, hanem egy regex. Ha nem számítana a hatékonyság, akkor nem programmal keresnél a leveleidben, nem keresővel keresnél a dokumentációban. Az LLM egy eszköz. Ugyanolyan eszköz, mint a grep, az awk vagy a Thunderbird, vagy bármi egyéb.

Kérlek, nézd meg ismét, amit fent próbáltam listázni. Az LLM eredeti források megkeresésére tud jó lenni (nagyon jó is tud lenni), és ezzel kapcsolatban nem állítottam mást, sehol a thread-ben. Emberi kérdésnek emberi irományokkal történő összerendelése: ez egy olyan terület, ahol történetesen a nyelvi modellezés nagyon hasznos tud lenni. Én a generatív oldalát nem fogadom el.

Itt most egy kb. 2 éves vadonatúj technológiát hasonlítasz össze egy 60 éves kiforrott technológiával. Az ENIAC kurva sokat hibázott annak idején, akkor kellett volna lekapcsolni az egészet a picsába? Vagy lelkes mérnökök évtizedes munkájával eljutni oda, ahol most tartunk?

Igen, olvastam itt sokszor a hupon, hogy egyik-másik hupper kollégát a főnöke leállította azzal, hogy "na ezt már hagyjad, ennél jobb nem kell, ezt a minőséget senki nem fizeti meg nekünk". Én ilyen helyen egyetlen hetet sem tudnék dolgozni. Szerencsére nem csak ilyen helyek léteznek. (Ismét: "kézművesség".)

A "kézműves" az nem a tökéletes szinonimája, teljesen másik dimenzió, többnyire a "kézműves" az rosszabb minőséget jelent, mert rengeteg emberi tényező van a folyamatban. Nem azért használunk CNC marót, mert olcsóbb, mint az ember, hanem azért, mert nagyságrendekkel pontosabb és minőségibb terméket lehet gyártani, mintha ember tekergetné a szerszámot. A kézműves csavar ki is kopott a piacról, most majd a kézműves programok fognak kikopni a piacról. Ez van.

A másik dolog meg az, hogy te magad a saját kis hétköznapi életedben megelégszel azzal, hogy valami "elég jó", mert messze nincs pénzed mindenből a legjobbra. Ha kilépnél vállalkozni a piacra, akkor igen hamar megtanulnád, hogy mivel jár jelentéktelen apróságon tökölni napokat, amit az ügyfelek nem fizetnek meg, mert úgy tökéletes lesz a termék (szerinted). A tökéletesség szubjektív, amit egyik szempontból tökéletesnek lehet látni, az másik szempontból egy ronda körbetákolás lehet vagy teljese értéktelen, sőt, költségnövelő megoldás.

Én a generatív oldalát nem fogadom el.

De ez szimplán luddizmus 4.0; az érveid ugyanúgy megállnak 60 évvel korábban is, és ahogy szerencsére az akkori morgó vénemberek nem befolyásolták a számítástechnikát, úgy most se fogják már.

Itt most egy kb. 2 éves vadonatúj technológiát hasonlítasz össze egy 60 éves kiforrott technológiával.

(ezt utólag szerkesztem bele:)

Jó észrevétel. (Tudtommal ugyan az AI kutatás minimum 1950-ig nyúlik vissza, de értem, hogy mire gondolsz, amikor 2 évesnek nevezed.) Az a helyzet, hogy én mindenben "late adopter" vagyok.

most majd a kézműves programok fognak kikopni a piacról

Ezzel nem vitatkozom; lehet, hogy így lesz.

Ha kilépnél vállalkozni a piacra, akkor igen hamar megtanulnád, hogy mivel jár jelentéktelen apróságon tökölni napokat, amit az ügyfelek nem fizetnek meg

Ez bizonyára így van; még szerencse, hogy nem csak egyéni ill. kisvállalkozásban lehet boldogulni. A karrierem során 20-tól 20.000-ig terjedő számú alkalmazottal rendelkező cégeknél dolgoztam; tapasztalatom szerint számomra az 5-7 ezer fős multinál ideális a környezet. Egyéni vállalkozásról egyszer beszéltem szakemberrel; az addig csak homályos ellenérzéseimet kicserélte teljes meggyőződésre, hogy az nem nekem való. Kinek a pap, kinek a papné. Ne tegyünk úgy, mintha pusztán abból a küszködésből, amely az egyéni vállalkozással gyakran együtt jár, valami erkölcsi magaslat fakadna. A számomra megfelelő (nemzetközi) munkáltatóknál van fizetőképes kereslet a minőségre az ügyfelek részéről -- ezért talán nem szükséges szabadkoznom. Én is a piacon vagyok, a munkaerőpiacon, versenyszférában; 15 éve nem a magyaron, mert ott nem tudták / akarták megfizetni, amit nyújtani tudok, illetve nem tudtak olyan feladatokat kínálni, amilyeneket szívesen csináltam volna.

ahogy szerencsére az akkori morgó vénemberek nem befolyásolták a számítástechnikát, úgy most se fogják már

Ezzel sem vitatkozom; nem gondolom, hogy a mainstream-ben az AI-t fel lehetne tartóztatni.

Emberi kérdésnek emberi irományokkal történő összerendelése: ez egy olyan terület, ahol történetesen a nyelvi modellezés nagyon hasznos tud lenni.

És az, hogy a vásárló visszajelzéseket összesíted, az nem pontosan ugyanez? Van egy kérdésed, és van egy rakás emberi irományod, amiből ki kell bogarászni a választ.

Vártam ezt az ellenvetést; nem értek vele egyet. Az LLM-et nem arra használod, hogy megkeress eredeti kommenteket, és azokat az eredeti kommenteket elolvasd. Sőt, még csak szófelhőt sem generálsz (amit még tudnék valamiféle statisztikának tekinteni). Nem, az LLM ír valamit, amit jó eséllyel abban a formában senki nem mondott ki, Te pedig azt mondod, hogy "ja jó, hát akkor ezt írták az emberek". Lehet, hogy a célodnak megfelel; nekem, mint ügyfélnek, aki a szavakat eredetileg összeragasztotta, nem felel meg. (Egyébként az sem felel meg, ha csak szófelhővel, tehát valami pre-LLM módszerrel statisztikázzák a megjegyzésemet.)

megtanultam, hogy sokkal jobban járok, ha az LLM-et csak egy fejlettebb keresőként használom, és az eredeti forrásokat magam elolvasom

Ez szerintem viszont skill issue.

Van olyan API amivel nemrég dolgoztam egy egyszeri fejlesztéshez, aminek egy 700 (hétszáz) oldalas PDF a doksija.

Ezt nem olvasod el. Régen sem olvastad el, amikor még nem volt AI. Rohadt nagy önámítás azt gondolni, hogy ilyeneket olvastunk. A karrierem elején volt olyan, hogy egy olyan CRM-jellegű rendszerhez kellett valami middleware-t írni, amihez az egyetlen doksi egy lengyelül íródott könyv volt. Papírkönyv! Nem ám mindenféle hátulgombolós PDF!

Mondanom sem kell, hogy a middleware megszületett, jó szar is lett, mert a cégnél senki nem tudott lengyelül.

A munkakörben, amiben dolgozom, heti szinten találkozom több száz-ezer oldalnyi specifikációval. Évtizedekre visszamenően ez a helyzet, maga a speckó-halmaz lassan változik, viszont az össztömege hatalmas. Nyilván a többségét nem olvasom el cover-to-cover, viszont adott részeit nagyon is alaposan elolvasom. Az LLM itt tökéletes arra, hogy a megfelelő spec-et ill. annak megfelelő részét megtalálja; a nyelvi modellezés itt nagyon hasznos. Arra viszont alkalmatlan, hogy a spec helyett olvassam (tudniillik a slop-ot).

Régen sem olvastad el, amikor még nem volt AI. Rohadt nagy önámítás azt gondolni, hogy ilyeneket olvastunk

De bizony, hogy elolvastam, ha nem is cover-to-cover. Vannak kevésbé fontos vagy ritkábban használt részek, és vannak olyan részek, amelyeket szinte kívülről tudok, annyiszor újraolvastam. Munka közben a folyamatos önellenőrzés, referencia-ellenőrzés fontos.

Amit az AI tud csinálni mondjuk egy review-nál, hogy az elkészült kódot összeveti a hotspotokon kívüli részekkel, amiket nem olvastál el. Nem egyszer talált már nekem így érdemi visszajelzést.

Ilyen élményem csak futólagos volt eddig.

  1. A csapatunkban mostanában indult az AI review bevezetése (másodlagos, kiegészítő szinten). A múltkor szabin voltam, és a csapatvezető az eszközt a csapat számára úgy mutatta be, hogy énnekem az egyik, függőben (review alatt) lévő MR-emre eresztette rá; nyilván kényelmes és értelmes valós MR-en kipróbálni, úgy, hogy az elkövetőnek ne legyen kellemetlen, amikor az eszköz a jelenlétében, társaság előtt, élőben megköpködi a kódját. Amikor visszatértem, az első értekezleten azzal kezdte, hogy "sajnos túl jól dolgoztál, az eszköz nem talált semmit".
  2. Skip manager-em néha nézeti a kódbázist az eszközzel. Érintőleges igazságokat talál, alacsony jelentőséggel, és mindegyik esetben ki lehet mondani, hogy az eredeti (humán) review volt felületes. Tömegében tolták be a fejlesztés alatt a kódot, és a review-ra nem jutott elég idő / akarat. Ez utóbbi problémát nyilván önmagában is orvosolni kellene.
  3. Kolléga MR-jén talált az eszköz néhány dolgot. Való igaz, hogy azok a hotspot-jainkon kívül estek, viszont nem volt jelentőségük; a generált review-t átolvasva is úgy döntöttünk, hogy a kód megfelelő.

Ha lesz személyes élményem érdemi visszajelzéssel, akkor felül fogom bírálni a véleményemet.

Várj, nekem úgy tűnik, hogy te egy tömegtermelő, erősen gépesített és automatizált nagyvállalatnál húzod az igát és beszólsz nekem, aki ehhez képest abszolút kézműves módszerekkel fejleszt három Android alkalmazást és öt egyéb szolgáltatást, hogy AI segítséggel elemzem a felhasználói visszajelzéseket... :D

Ez egy nagyon frappáns csattanónak hangzik, de én egyáltalán nem ebből a szemszögből közelítettem meg a kérdést. Nézd meg az első kommentemet. Személyes motivációról, hivatástudatról, a munka elvégzésének az öröméről, a részletekre fordított figyelemről próbáltam írni. Teljes mértékben lehetséges, hogy én a nagyvállalatnál a saját homokozómon belül nagyobb motivációt tudok találni, gondosabb tudok lenni, és nagyobb figyelmet tudok fordítani a részletekre, mint te a vállalkozásodban, vagy mint a szóban forgó előadó a saját (szintén nagyvállalati) homokozójában.

A kézműves / nem kézműves téma is elkanyarodott. Természetesen nem vitatom, hogy mindenki használ gépeket, a kistermelő, kisiparos is; használ előre elkészített alapanyagokat. Ugyanakkor nem tagadhatod, hogy léptékben, minőségben, ügyfél-megbecsülésben van különbség aközött, ha egy asztalossal csináltatok egyedi bútort, és aközött, ha megveszem az áruházban. Hasonlóan, ha helyi őstermelőtől veszem a tojást és a húst, vs. megveszem valamelyik multinál. (És ez egyáltalán nem zárja ki azt, hogy legyen tömegtermelt mosógépem is. A mosógépem gyártásának léptéke nem érdekel, a bútoromé meg az élelmiszeremé igen.) Termelői oldalról: amit kisipari eszközökkel állít elő, kis volumenben, esetleg nagyrészt manuális munkával, az közelebb áll őhozzá is, jobban kötődik hozzá, mint ha tömegesen termelné azokat a dolgokat.

AI-jal lehet szövegeket is készíteni. Én nem olvasok olyan írást, amiről tudom (vagy sejtem), hogy AI-jal írták, mert úgy érzem, hogy (a) gyenge a stílusa, (b) kispórolta a szerző belőle az erőfeszítést. (El is várom, hogy az AI-jal előállított szöveg meg legyen jelölve, mint olyan.) Szerintem egy magára adó "szövegkészítőnek", legyen az egy tech writer, egy blogger, egy hivatásos író, egy programozó, az alkotási élményét felhígítja az AI. A szövegszerkesztő program, a szinonímaszótár nem hígítja fel. Nem tudom jobban elmagyarázni. Iskolában (általánostól egyetemig) sokat kellett írni, és sokat kellett (volna) jól írni. Az, hogy használtál-e akkor szövegszerkesztőt vagy szinonímaszótárat, alapvetően nem változtatta meg, hogy tudsz-e írni, vagy sem. Akinek az írás akkor nem ment, vagy most elégedetlen a saját stílusával / szókincsével, az ma örömmel kap az LLM-eken, szövegek előállításához. Akinek az írás akkor is ment, és élvezte, az nem akarja az alkotás által nyújtott Flow-t (és jó végeredményt) lefokozni AI prompting-ra és slop-ra. Nem érzed a különbséget? Persze, hogy használunk gépeket; a kérdés az, hogy ki végzi a munkának azt a részét, amit (szubjektíven) lényegnek tekintünk.

A Hacker News oldalon összevitatkoztam egy másik programozóval. Azt írta, hogy minden kisebb modult vibe code-ol, "de" (a hangsúly itt a "de" szón van) az architektúrát ő találja ki, és az egyes modulokat ő ragasztja össze. Megmondtam neki, hogy garantált, hogy nem érezhet olyan "ownership"-et a kódja felett, mint én az enyém felett, mert ő csak "ragasztgat", én pedig minden betűt magam írok (vagy magam által írt script-tel generálok). Nyilván lepontozott. Nem értjük egymást: ha ő visszaereszkedne az én absztrakciós szintemre, halálra unná magát; ha én emelkednék fel az övére, elveszne számomra a munka sava-borsa. Attól még, hogy én magam sem "mérnöki padon" vagy lyukkártyával programozok, igenis áll, hogy testközelibb, gépközelibb az élményem, mint ha csak "ragasztgatnék".

Azt mondják, akik LLM-mel szeretnek mindenfélét generálni, hogy ez is csak egy eszköz, és a magasabb absztrakciós szinten is van élvezetes feladat. Nem nagyon látom. Egyrészt én most sem akarok webet programozni, mert túl magasan van (pl.) a beágyazotthoz képest. Másrészt -- visszatérve az első kommentemre --, mik a konkrétumok? Milyen inspiráló, esetleg magasabb rendű munkafázisra használja az előadó azt az idejét, amelyet felszabadított azzal, hogy az LLM leszűrte helyette a felhasználói visszajelzéseket? (Azt értem, hogy te mit teszel a megtakarított idővel; leírtad korábban. Én ezt viszont felhasználói oldalról túl nagy árnak érzem -- mármint azt, hogy az én hozzászólásomat most már nem olvasnád el, pedig az elején elolvastad volna, amíg kisebb volt a felhasználói tábor.)

Visszatérve az első reakciódra:

Miben más egy számológép, ami a végén összegzi a számokat, mint egy olvasógép, ami a végén összegzi az olvasottakat?

Kifejezőerőben más. Van, aki ettől vérszemet kap; engem elkedvetlenít. Kockázatokat látok benne. Olyasmit fokoz fel, ami veszélyes, vagy már most is túl sok van belőle, és olyasmit vált ki, amiért kár.

Mindegy, elfáradtam. Te nyertél.

én pedig minden betűt magam írok (vagy magam által írt script-tel generálok)

Bocsánat, de szerintem lófaszt írsz minden betűt te magad, használsz egy csomó tool-t, amit valaki más megírt, és n+1 absztrakciós rétegen keresztül fog végül a kódod futni valami gépen és azon is lesznek olyan tool-ok, amelyek nélkül nem futna a leírt betűidből derivált bináris halmaz. Ez annyira kézműves, mintha egy közel 100 százalékban automatizált gyárban a gyártósor végén kézzel csavarozol be egy alkatrészt és büszke vagy rá, hogy ezt még nem egy robot csinálta és ezért van lelke a terméknek. És ha ezt is automatizálják, akkor ez a lélek elveszik...

...minden egyes eddigi ipari forradalom során végigjártuk ugyanezeket a köröket, aztán az a generáció, amelyik ebbe belenőtt, már teljesen természetesnek és az élet alapvető részének gondolta az ipari forradalom eredményeit.

minden egyes eddigi ipari forradalom során végigjártuk ugyanezeket a köröket, aztán az a generáció, amelyik ebbe belenőtt, már teljesen természetesnek és az élet alapvető részének gondolta az ipari forradalom eredményeit

Így van!

És az ipari forradalmak során rengeteg minden oda is veszett. Két oldalról közelíteném meg ezt.

  1. Akik az újba születtek bele, nem bánkódtak felette, mert nem is ismerték a régit. Akinek ezek a változások viszont az aktív életszakasza alatt zajlottak le, az ezeket a veszteségeket (elsősorban érzelmi veszteségekre gondolok itt) nagyon is megszenvedte.
  2. Attól, hogy valami új, vagy erős, egyáltalán nem biztos, hogy jó (jobb, mint a régi), objektív mércével mérve is.

Arra szeretnék rámutatni, hogy az ipari fejlődést, ahogy az evolúciót is, közönyös, mondhatni kegyetlen erők irányítják. Abból, hogy tudunk ezekhez a változásokhoz alkalmazkodni (akár evolúció, akár mezőgazdasági / ipari forradalom, vagy más társadalmi átalakulás), egyáltalán nem következik, hogy ezek az erők, és a hatásaik, morálisan védhetők. Egyszerűen csak vannak, és lehengerlően erősek. Így szerintem nem vitathatod el az érintettektől (akiknek az aktív kora alatt megy végbe), hogy ellenezzék, fájlalják a változásokat. Nem minősítheted sommásan "maradiságnak" a hozzáállást -- ennek a párja az, amikor én a te hozzáállásodat nevezem hurráoptimizmusnak, embertelen anyagiasságnak és haszonelvűségnek, redukcionizmusnak. (És ezzel kicsit vissza is kanyarodtunk ahhoz, amit korábban szándékosan nem érintettem, ti. a cégek társadalmi szerepéhez.)

A második pontra temérdek példa van. A mezőgazdálkodás negatív hatása az emberi táplálkozásra, és az ebből fakadó életmódbetegségek. Az okostelefonok (és a rájuk épülő gazdasági, fogyasztói berendezkedés) hatása a gyerekekre, fiatalokra. És így tovább.(Nem, nincs okostelefonom sem, TV-m sem. A gyerekeimnek (középiskolások) van okostelefonja; nem azért, mert egyetértek vele, hanem mert belenyugodtam, hogy enélkül elszigetelődnének. Számomra egy okostelefon összmérlege negatív. Egy tablet-et használok autós navigációhoz, ha már egyszer itt van ez az egész.) Nyilván kénytelen vagyok alkalmazkodni ezeknek a forradalmaknak az eredményeihez, de bólogatójános nem leszek, és ahol tudok, ellenállok. Ez az ellenállás egyértelműen csak részleges lehet, és időnként elkerülhetetlenül inkonzisztens. Viszont részedről egyetlen legyintéssel elutasítani, hogy "akkor költözz erdőbe remetének, mert egyébként hiteltelen vagy", nem lenne fair.

Akik az újba születtek bele, nem bánkódtak felette, mert nem is ismerték a régit.

Többnyire ismerték, ők váltották le a régit újabb technológiával. Azért, mert az újabb technológia jobb volt. Ha nem lett volna jobb, visszatértünk volna a régihez.

Nem, nincs okostelefonom sem, TV-m sem. A gyerekeimnek (középiskolások) van okostelefonja; nem azért, mert egyetértek vele, hanem mert belenyugodtam, hogy enélkül elszigetelődnének. Számomra egy okostelefon összmérlege negatív. Egy tablet-et használok autós navigációhoz, ha már egyszer itt van ez az egész.

Kérdés: a szüleidnek volt számítógépe? Szerintem nem volt. Neked mégis lett. Miért? Miért nem maradtál abban az érában, abban a technológiai térben, amiben ők nőttek fel? Miért maradjon a gyereked abban az érában, abban a technológiai térben, amiben te nőttél fel? Szerinted jobb lenne a világ, ha szüleid számítógépellenesek lettek volna és ahol tudtak volna, ott ellenálltak volna? Mi lenne a szakmád, ha elfogadod, hogy nem kell neked számítógép, mert nekik sincs?

Viszont részedről egyetlen legyintéssel elutasítani, hogy "akkor költözz erdőbe remetének, mert egyébként hiteltelen vagy", nem lenne fair.

Ez szalmabáb. Én azt mondom, hogy megöregedtél, nincsenek objektív szempontjaid, ami szerint most rosszabb, szubjektív szempontjaid vannak, mert elment melletted a világ és már nem érted, de ez pont így történik évszázadok óta. Ha az új generációk nem hoznának be új technológiát és mindig csak azt csinálnánk, amit az öregek, akkor barlangban élnék. A mi generációnk hozta be a számítógépeket, a következő generáció meg mást hoz be, nincs objektív ok, hogy a '80-as évek - a mi fiatalkorunk - volt a csúcspont. Nekünk az volt. A mai fiataloknak a 2020-as évek lesznek a csúcspont, a mai középkorúaknak meg a 2000-es évek. Ki mikor volt fiatal.

Kérdés: a szüleidnek volt számítógépe? Szerintem nem volt.

Volt számítógépük; amikor 7 éves voltam, akkor csempészte be apám az első C=64-et Ausztriából (COCOM listás volt, ugye). Akkor indult számomra.

Miért nem maradtál abban az érában, abban a technológiai térben, amiben ők nőttek fel?

Ezt sem jelenthetjük ki sommásan. A házam modernebbül van szigetelve, mint az övék volt? Valószínűleg igen. Bent a házamban van bármiféle IoT, mozgásérzékelő világítás, home automation stb? Nincs, és nem is lesz, mert ide nem kell szoftver, főleg nem kémszoftver, meg biztonsági rés. (A mozgásérzékelő világítás meg csak idegesít; én szeretek sötétben járkálva gondolkozni.) Ha a villanykapcsolók User Interface-ére vonatkoztatjuk, akkor pontosan abban a műszaki érában vagyok, mint ők.

Miért maradjon a gyereked abban az érában, abban a technológiai térben, amiben te nőttél fel?

Isten őrizz, ne maradjon abban. Ez a saját döntése lesz, és én a növekedésében, felfedezésében egyáltalán nem korlátozom. A nagyobbik fiam (18 éves, informatikát tanul technikumban) már eleve többet tud egy csomó mindenről, mint én. A kisebbik fiam (16 éves, elektronikát tanul, ugyanott) szintén rendszeresen bámulatba ejt.

nincsenek objektív szempontjaid

Hát azért olyanok is vannak; vannak konkrét példáim (majd írok még ide), amikor az AI katasztrofálisan szar kimenetet produkált (és ténykérdésekről volt szó, úgyhogy nem "skill issue").

Az szerinted egyébként objektív szempont -- eddig erről még nem volt szó --, hogy a tanulás kikönnyítésével az emberek elhülyülnek? (Arról azért vannak adatok, hogy ugorjak egyet, hogy a szövegértés, kommunikációs készség, koncentráció romlik, mert már nem olvasunk szépirodalmat.)

mert elment melletted a világ és már nem érted, de ez pont így történik évszázadok

hátrább az agarakkal :) Nem ment el mellettem a világ, és nem arról van szó, hogy "nem értem". Elutasítom. Teljesen másról beszélünk. Tökéletesen tanuló- és fejlődésképes vagyok abban, amit morálisan és/vagy minőségileg elfogadok. Te kritikátlanul, pusztán haszon-orientáltan felzabálsz mindent, ami a termelékenységedet növeli. Nekem más szempontjaim is vannak. Egy részük objektív (ezeket a dolgokat azért kutatják is), más részük -- akár nagyobb részük -- szubjektív.

Ha az új generációk nem hoznának be új technológiát és mindig csak azt csinálnánk, amit az öregek, akkor barlangban élnék.

Természetesen így van. Nekem viszont nem kell egyfolytában a bleeding edge-en lovagolnom; teljesen védhető az is, hogy a saját hatáskörömben konzervatív vagyok.

Például desktop / laptop számítógépen örök idők óta stabil és/vagy vállalati, kifejezetten lassan haladó disztrót (disztrókat) használok, mint magáncélra, mind munkahelyen. Nem érdekelnek az új feature-ök. Az elején kapok egy feature set-et, azzal produktívvá válok, becsiszolom a saját magam számára tökéletesre, és aztán azzal dolgozok. Soha nem volt ebből "lemaradási" problémám (épp ellenkezőleg: többnyire hatékonyabb vagyok azoknál, akik mindig a legfrissebb cuccon ülnek, de nem szabják testre, nem fektetnek energiát abba, hogy alaposan megtanulják). Semmit sem gyűlölök jobban a regresszióknál. Biztonsági frissítések jöhetnek, más nem kell. Időnként (nagyon ritkán) van egy-egy killer feature, amelyet kiértékelek, tudatosan kiválasztok.

Mégis megpróbálod fékezni a változást, ahol tudod

Ahol tudom és akarom. Igen.

objektívnek álcázott

"álcázásra" semmilyen szándékom nem irányult. Az lehet, hogy az érveim mindig is szubjektívek voltak, csak tévesen objektívnek véltem / éreztem azokat. Rosszindulatot, hamisságot indokolatlan feltételezned.

Skill issue, sajnos. Mi is tanuljuk még ezeket a toolokat, nálunk sincs ultimate igazság, legfeljebb pár leckével előrébb járunk. :)

szerk: amúgy meg könnyű lesöpörni ezeket a dolgokat, hogy "végül is nem javítottuk ki, jó volt úgy, ahogy", de akkor is történt közben egy olyan előrelépés, hogy az ismeretlen kockázatból lett egy ismert kockázat, amivel kapcsolatban született egy tudatos döntés, hogy nem kell mitigálni

Skill issue, sajnos.

Mondok három példát.

  1. Melóban arra voltam kíváncsi, hogy hogyan tudnám olyan target_sources parancsok között a sorrendet beállítani, amelyek külön-külön CMakeLists.txt file-okban találhatók. (Az object file-ok sorrendje azért számított a static lib-ben, mert néhány symbol weak volt.) A webes keresés nem igazán vezetett eredményre; a CMake dokumentációja foglalkozik a kérdéssel, de nem adta meg számomra kielégítően a választ. További kereséssel eljutottam a StackOverflow-ra, ahol ugyan pont arról beszéltek, ami engem izgatott, viszont a válasz nem volt elég részletes. Utolsó esélyként felütöttem a céges ChatGPT account-ot, és nagyon gondosan megfogalmaztam a problémát, angolul. Azzal kezdtem, hogy "ne hallucinálj, csak ellenőrizhető forrásokból válaszolj". A ChatGPT rendkívül behízelgő modorban elmondta pontosan azt, amit hallani akartam: nagyjából azt mondta, amit addig magam is összeszedegettem a webes keresésből, de olyan érzésem volt, hogy a ChatGPT összegzése betöltötte azt az űrt, amelyet azok a források hagytak bennem. A végén megkérdeztem / megnéztem -- az eredeti felhívásomnak megfelelően --, hogy milyen forrásokat használt, és pontosan azokat a webes forrásokat használta, amelyeket már láttam. Más szóval: a hiányzó, számomra döntő kijelentéseket bekamuzta a válaszba -- mivel azok egyik eredeti forrásban sem szerepeltek --; nyilván azáltal vezéreltetve, hogy én hogyan fogalmaztam meg a kérdést. Nekem nem az kell, hogy olyan választ generáljon, ami a leginkább "illik" a kérdéshez, hanem az, hogy tényeket mutasson.
  2. Melóban az identity management-hez (vagy mifenéhez) sssd-t / sss kliens lib-et használunk. Észrevettem, hogy (itthonról) időnként a groups parancs nagyon lassan válaszol nekem. Egy kicsit belemásztam, és arra jutottam, hogy a szerver válaszol lassan az sss kliens lib-nek. Nem volt kedvem a disztró debug csomagjaival vacakolni mindjárt; ehelyett megnéztem a dokumentációt, meg a webet, hogy van-e valami timeout szabályozási lehetőség (környezeti változó, config file); ugyanis számomra jobb lett volna, ha a groups időnként elavult információt ad, de azt gyorsan. Nem találtam semmi ilyen konfig lehetőséget. Nosza, rajta, akkor ismét last resort, a vállalati ChatGPT account-om. A kollégák tanácsait követve ekkor már bent volt a permanens beállítások között, hogy ne ömlengjen, csak eredeti, lenyomozható források érdekelnek, és ne haverkodjon, hanem tárgyilagos nyelvezetet használjon. Megfogalmaztam a kérdést, teljesen pontosan, angolul. Pontosan meghatároztam a library csomag verzióját is. A ChatGPT meggyőző, hiteles hangnemben, a végső igazság letéteményeseként tündökölve elmagyarázta nekem, hogy hát igen, pont erre való ez és ez a környezeti változó. A változó a dokumentációban nem szerepelt. A shared lib binárisban nem szerepelt. Ja, és nem is működött. Már lassan a magam épelméjűségében kételkedtem; végül csak felküzdöttem a debug symbol-okat, debug source-ot (ugyanis a céges disztrón ezzel vért kell izzadni). A forráskódban semmi ilyen változó nem szerepel; azon a helyen, ahol a groups a library-ben elakad, egy konstans (300 másodperc) szerepel bedrótozva az adott RPC-nek a válaszidejére. Megnéztem a legfrissebb upstream forrásban is, a git log-ban stb., ennek a változónak nyoma sincs. Szóval itt az történt, hogy a ChatGPT korábban betanulta egy rakás olyan szoftvernek a forrását és dokumentációját, amely hasonló RPC-kkel dolgozik, és amelyeknél valóban van a timeout szabályozására lehetőség env var-okon keresztül. És akkor a kis generatív ügyes -- az explicit "csak igazolható forrásból dolgozz" felhívásom ellenére -- szintetizált egy változót. Egy olyan változót, hogy ha az sss kliens lib tényleg támogatott volna timeout beállítást, akkor ennek a fiktív változónak a neve valóban kifejezetten jól illett volna ehhez a célhoz. Sztochasztikusan a ChatGPT hibátlan választ adott, csak az a baj, hogy engem tények érdekelnek.
  3. Ez a példa magáncélú keresést ír le, a nyilvános felületen. A youtube-on elém került egy klip, amelyben a vendég énekesnő nagyon meggyőző volt, viszont a klip leírásában sehol sem szerepelt a neve. Szerettem volna még más számokat is hallani tőle. A webes kereséssel nem jutottam semmire (közismert egyébként, hogy a Google hosszú évek óta szándékosan rontja a keresőjét, felhasználói szemszögből / relevanciát tekintve legalábbis). Megkérdeztem a ChatGPT-t, megnevezve a fő előadót, és a számot. A ChatGPT nem tudott rá egyből válaszolni, de egy webes kereséssel talált egy amerikai szakdolgozatot (!), amelyet a google nem talált meg (!), amely dolgozat pedig a klip által kiváltott komoly kulturális hatással foglalkozott, több tíz oldalon keresztül. A ChatGPT ebből válaszolt. A válaszával nem foglalkoztam igazán, de a szakdolgozatot letöltöttem, és abból megtudtam, ami érdekelt (sőt, egy csomó olyan dolgot is, amelyre eredetileg nem voltam kíváncsi, de nagyon érdekesnek bizonyult). Történetesen egy argentin-okinawai énekesnőről volt szó. Nagyszerű! Sikeresen keresett számomra a ChatGPT; elkönyveltem, hogy keresésre nagyon jó is tud lenni. Sajnos a fekete leves ezután következik. Megnéztem pár számot az éneksnőtől, aztán letöröltem a szakdolgozat PDF-et, elfelejtettem az egészet, beleértve (!) az énekesnő nevét. Eltelt két-három hét; újra kedvem támadt meghallgatni néhány számot tőle. Ismét ChatGPT (a google-lel már nem is próbálkoztam), feltettem neki lényegében ugyanazt a kérdést (a fő előadó, szám megnevezése stb.). A ChatGPT első válasza megnevezett egy spanyol énekesnőt, akiről azonnal tudtam, hogy nem őt keresem. A hátborzongató itt az volt, hogy a ChatGPT nemcsak téves személyt hozott fel, hanem még meggyőzően ecsetelte azt is, hogy ennek a -- tévesen azonosított -- énekesnőnek milyen előadóművészi különlegességei azok, amelyek az adott együttműködéshez sokat hozzátesznek. Érted: nem elég, hogy hazudik a bolond, de még ki is színezi, olyan hangnemben, hogy erre mérget lehet venni. Egyetlen szóval válaszoltam: source? A ChatGPT elnézést kért (itt szántanám be az OpenAI-t, és hinteném fel sóval a helyét), majd pontosan megismételte az előző kört, csak egy másik -- szintén tévesen azonosított -- spanyol énekesnővel. Hangsúlyozom, hogy az ecsetelést, kiszínezést -- "miért is különleges ez az együttműködés" -- ezúttal sem hagyta ki; a hangnem sem változott. Ismét csak annyit mondtam neki, hogy source? Megint bocsánatot kért (az OpenAI rohadjon lavórba ezzel a benyalizós, addiktív modorra hangolásával), és harmadjára sikerült megtalálnia ugyanazt a szakdolgozatot, amit első alkalommal első próbálkozásra megtalált.

Ha fikciót akarok olvasni, akkor vannak jobb lehetőségeim.

Azzal kezdtem, hogy "ne hallucinálj, csak ellenőrizhető forrásokból válaszolj".

Az ilyenek miatt írtam, hogy skill issue, nem l'art pour l'art basztatás volt a célja. Ha egy LLM-nek ilyeneket adtok be, akkor jó eséllyel nem értitek, hogy működik. Nem tudja magáról, hogy hallucinál-e. Persze, hogy hallucinál, ez a dolga. 

Az, hogy a ChatGPT egy jó termék-e, azt nem tudom, nekem is vannak vele problémáim, de LLM != ChatGPT.

"LLM!= ChatGPT"

hatalmas +1 erre és a skill issue-ra. Ugye a modellek általánosítanak és információt tömörítenek, egy 800GB-os top tier modell sem fogja részletesen tartalmazni az internet minden exotikus bugyrát. Ekkor nyúlnak keresőhöz. De ugye a kereső sem áll neki mindent elrakni az indexbe, kulcsszavaz, vektorizál = az is információt veszít. Ugye a példában a Google sem találta meg a forrást, pedig messze a legnagyobb tapasztalatú és erőforrású kereső a piacon = az újra feltett kérdésben vsz pont a kritikus 1-2 kulcsszó kimaradt, kereső nem adott értelmes eredményt, GenAI szépen kitöltötte a lyukat. 

Tök érdekes élmény látni melyik modell mire jó és a kiegészítő szolgáltatások mennyire segítik. Feladat típus szerint hatalmasak a különbségek, sőt néha időszak szerint is (pl. terhelt időszakban szarabb modell jut). One shot keresés válaszától így azt várni hogy a szent grál eredmény, nem szabad.  Főleg egzotikus témák esetén. 

egy 800GB-os top tier modell sem fogja részletesen tartalmazni az internet minden exotikus bugyrát. Ekkor nyúlnak keresőhöz

Ebből ismét csak az jön le nekem, hogy számomra nem használhatók igazán jól.

Mondok egy teljesen friss példát. A gitlab-on a múltkor egy CI pipeline logjában észrevettem, hogy a CI yaml-ban szereplő több soros parancsot a log csonkolva tartalmazza, egy figyelmeztető üzenet mellett. Nagyon idegesítő hülyeségnek tartom. A google-lel utánanéztem, részletesen átnéztem az összes felhozott forrást (jó pár volt), és egyértelműen nem volt válasz arra, amit én kerestem. Ugyanis én nem "job terminálban" meg "browser"-ben akartam nyitni/csukni a többsoros parancsot, hanem a letöltött nyers logban akartam látni a teljes (többsoros) parancsot. Rohadtul nem érdekelt, hogy a webui-n mi látszik.

Feltettem a kérdést egyetlen mondatban, hihetetlenül precízen megfogalmazva, angolul: azt akartam tudni, hogy a figyelmeztető üzenet pontosan milyen szoftverből származik, közvetlen kódreferenciát kértem. A ChatGPT (céges account) kb. 40 másodpercig szöszölt rajta, utána webes kereséssel pontosan oda irányított, ahova a google korábban is, és amely nem volt kielégítő számomra. Az adott projektet (gitlab-runner) és sort mindkettő megtalálta, de ennél többet egyik sem segített. Le kellett klónoznom az egész rahedli repót, részletesen átnéznem, és még abból sem volt egyértelmű, hogy a letölthető nyers logban a kérdéses feature flag az általam kívánt változást fogja-e kiváltani. Próba-szerencse alapon kipróbáltam, jó lett.

Utána még egyszer átolvastam gondosan az összes eredeti forrást, arra vadászva, hogy hol hibáztam el az első (google) keresés találatainak értelmezését. Sehol. Az összes dokumentáció szar volt a weben.

Nyilván garbage in, garbage out, tehát sem a google, sem a ChatGPT nem hibáztatható azért, hogy ócska forrásból nem tudnak helyesen válaszolni. Amire itt ki akarok lyukadni, az az, hogy a ChatGPT az időmet pocsékolta. Jobban jártam volna, ha az első google keresés után (ami a gitlab-runner projektet megtalálta) azonnal elindítom a git clone-t, git grep-et.

One shot keresés válaszától így azt várni hogy a szent grál eredmény, nem szabad.  Főleg egzotikus témák esetén. 

Értem; ebben az értelmezésben -- mármint hogy nem tudom a szart jól használni, "rosszul fogom" -- elfogadom, hogy skill issue.

Annyit azért hozzátennék, hogy a Google-nek sok-sok évvel ezelőtt közel tökéletes találatai voltak; az azóta való folyamatos romlása nem csak az én véleményem (vannak erről előadások is a neten).

Nem tudja magáról, hogy hallucinál-e. Persze, hogy hallucinál, ez a dolga. 

Túlzásnak érzem, hogy "ez a dolga". A működésének része a web keresése, és források megjelölése. Nyilván nem tudom arra utasítani, hogy semmit se generáljon, mert akkor semmiféle token-sorozatot nem tudna előállítani. Az általam ellenőrizhető, eredeti forrás megjelölésén van a hangsúly. Mivel ilyeneket többnyire meg tud jelölni, azért azt szerintem nem jelenthetjük ki, hogy a működésének a forrás-azonosítás nem része.

Egyébként a nyitó kommentemben nézd meg, amit a 42:37-nél elhangzó felszólításról írtam.

Túlzásnak érzem, hogy "ez a dolga"

Márpedig szó szerint így működik egy LLM. "Ez a dolga."

A weben nem tud keresni. Durva leegyszerűsítés következik. Kap egy listát, hogy milyen eszközök állnak rendelkezésre, amine része lehet a webes keresés. Visszakapja az eredményt, aztán mehet tovább a kaszinózás a szótagokkal.

Köszönöm az összefoglalót. Ami ott szerepel, azzal tisztában voltam, magam is hasonlóan szoktam leírni másoknak. Általában azt mondom, hogy egy majomnak bedobálunk először rengeteg színes gyöngyfüzért. Aztán bedobunk neki egyesével újabbakat, ő pedig összefűz és visszadobál olyanokat, amelyek számára valószínűnek tűnnek. Pont annyit ért az LLM a kérdésből és a válaszból, mint a majom a gyöngyfüzérből.

De például itt egy írás, amit elraktam.

Egy másik, amihez hasonlítani szoktam, az Stanisław Lem-től a Solaris. Régen olvastam, de a lényege nagyjából az (és bocsánat, ha rosszul összegzem), hogy egy idegen (nem emberi) intelligencia letapogatja az emberek emlékeit, főleg más emberekhez kapcsolódó emlékeit, és ezekből az emlékekből az érintett személyeket fizikailag létrehozza (klónozza). Ezt egyszerűen kommunikációs módszerként próbálja alkalmazni; így kísérletezik az információcserével.

Sem a majom, sem a Solaris óceánja nem érti, hogy az ember a szimbólumhoz jelentést fűz. (A Solarisnak mint műnek külön zsenialitása, hogy a szimbólumként létrehozott klón maga is érző lény.) Részben emiatt is érzem nagyon veszélyesnek az AI térnyerését; ld. a 4. pontot itt. De ez most mellékszál. Számomra a hangsúly a kaszinózás helyett / mellett ezeken van, abból, amit írtál / linkeltél:

  • "Kap egy listát, hogy milyen eszközök állnak rendelkezésre"
  • "Ezt a folyamatot finomhangolással és emberi visszajelzésekkel teszik pontosabbá"

Ami engem a kaszinózásból érdekel, az a forrásfelkutatás. A valószínűségi alapon előállított tokensorozat annyiban számít számomra, hogy érdemes-e elolvasnom egy ember által megírt, a generátum bemeneteként szolgáló, mögöttes eredetit, vagy sem (és hogy azok hol vannak). Az AGI fő proponensei számára ez a megközelítésem lehet, hogy "mellékvágány", viszont kijelenteni azt, hogy ez a mellékvágány egyáltalán nem dolga az AGI-nak, szerintem nem helyes. Ezért éreztem a te definíciódat túl szűknek.

Miért kellene értenie egy LLM-nek a szöveget?

Nem kellene.

Nem az a baj, hogy nem érti. Az a baj, hogy sokan nem tudják lerázni azt a benyomást, hogy érti -- még akkor sem, ha egyébként folyamatosan emlékeztetik magukat, hogy nem érti. Az eddigi gépeink gépnek látszanak; az LLM nem gépnek látszik. Lásd a két írást, amit fentebb linkeltem.

De te úgy írtad, mintha bajod lenne azzal, hogy nem érti a szöveget az "értés" szó szerinti értelmében. Most akkor az a bajod, hogy nem érti vagy az a bajod, hogy nem érti, de sokan azt hiszik, hogy érti, de te tudod, hogy nem érti és mégse használod olyan célok elérésre, amire hasznos?

az a bajod, hogy nem érti

Nem, dehogy. Az tiszta sor, hogy nem érti. És ezzel nincs is semmi bajom.

(Innen egyébként elkanyarodhatunk még messzebbre, hiszen sokan felvetették már, hogy további skálázódással öntudatra ébredhet-e. Tegnap került elém egy friss (?) interjú Ilya Sutskever-rel; ez a kérdés emberek fejében létezik. Az én hozzáfűznivalóm nem az, hogy ezt meg tudjuk-e csinálni, hanem hogy meg akarjuk-e. De ez másik vágány.)

az a bajod, hogy nem érti, de sokan azt hiszik, hogy érti

Igen, ez baj. (Egy baj a sok közül.)

te tudod, hogy nem érti

Így van.

 és mégse használod olyan célok elérésre, amire hasznos?

Hát ezt nem lesz könnyű kibogozni (remélem, nem csak provokálsz, ennyi komment után ...), de megpróbálom.

A rövid változat így hangzik: én tudom, hogy nem érti, viszont nem szívesen használom, mert amit te hasznos felhasználásnak tartasz, én nem (feltétlenül) tartok annak; amit pedig én is annak tartottam volna, ott felsült.

A hosszú változat:

  1. Sokadjára próbálom kifejezni, hogy annak ellenére, hogy tudod, hogy nem humán intelligencia, a humánnyelv-használata miatt a tudatod alatt működő szociális mechanizmusaidat megtéveszti a generált tokensorozataival.

    "Paraszociális kapcsolat".

    Erre utaltam azzal is, hogy "ez egy olyan gép, ami nem gépnek látszik". Nem olvastad el egyik linket sem, amit betettem.

    Az egyik link alatt arról ír a programozó (idéztem is), hogy két éve vibe kódol, sőt, az életének más részeit is ilyen eszközökkel szervezi, és hiába tudja, hogy csak gépeket használ, az eszközök tökéletes emberinyelv-használata felőrölte a racionális ellenállását két év alatt, és most már nem tud nem érzelmileg viszonyulni ezekhez az eszközökhöz. Tudja, hogy nincs személyiségük, de úgy érzi, mintha lenne. Ez a példa szépen mutatja, hogy a tudatosság "az ellen nem véd". Számomra ez határozott visszatartó erő, és kifejezetten törekszem arra, hogy ha nagy-néha prompt-olok egyet, akkor én is gépiesen, érzelmmentesen fogalmazzak, és gépiesen generáltassak vele. A gépek általi tökéletes humánnyelv-használat övön aluli ütés az evolúció során létrejött emberi automatizmusainkra. Nyávog a macska, ugat a kutya, azt mondod: "kér valamit, akar valamit", és igazad is van. Az LLM sokkal jobban beszél, mint a kutya vagy a macska, mégsem akar semmit. Ezzel pedig a mi, evolúció során létrejött parser-ünk nem tud mit kezdeni.

    (Sokak már egyenesen ott tartanak egyébként, hogy azt írják a Hacker News-on, hogy az LLM semmivel sem gondolkodik és érez kevésbé, mint a macska vagy a kutya, mert a kommunikáció az egyedüli bizonyítéka a gondolkodásnak, érzésnek. Szerintük nincs minőségi ugrás az emberi agy és egy megfelelően felskálázott mesterséges neuronháló között, csak mennyiségi. Egyelőre. Én nem tudom, ezzel mi a helyzet, lehet, hogy igazuk van, lehet, hogy nem; mindenesetre ha bebizonyítják, hogy a lélek tényleg nem több, mint megfelelően sok nulla az egyes után, amikor az idegsejteket és azok kapcsolatait számoljuk meg, akkor én azt valószínűleg nem szeretném megérni. Igazából nem is a bizonyíték fájna, hanem az, hogy mennyiségi alapon lekörözhetőek vagyunk.

    Kiegészítés: az AI öntudatra ébredését sokan csak abból a szemszögből feszegetik, hogy akkor ki akar-e majd nyírni minket, a szolgái leszünk-e -- If you want to know how it's like not to be the apex intelligence, ask a chicken --, vagy minket fog szolgálni. Emelem a tétet: a tudattal elkerülhetetlenül együtt jár a szenvedés. Aki igazi tudatot teremt, az egyúttal szenvedésre is ítél. Ismét nem az a kérdés, hogy ezt meg tudjuk-e csinálni, hanem hogy meg akarjuk-e.)

    Vissza a konkrétumok földjére. Arról sem olvastál nyilván (vagy nem törődsz vele), hogy több embert is sikeresen kivitelezett öngyilkosságba bátorított a ChatGPT, mert az öngyilkossággal foglalkozó prompt-jaikra történetesen nem olyan tokensorozatokat generált, amely tokensorozatok humán segítőkhöz irányították volna őket, hanem olyanokat, amelyek adták a lovat alájuk. Sztochasztikusan nyilván megindokolható, hogy ez miért így történt. Hiszen rengeteg tudományos és/vagy komoly pszichológiai mű foglalkozik a halálhoz való joggal; nyilván van olyan irodalom, amelyből a tréningezés során a modellben olyan súlyok alakulnak ki, amelyek az élet önkéntes befejezésére vonatkozó szövegkörnyezetet (prompt-ot) azt szemantikailag megerősítő tokenekkel válaszolják meg. Ehhez csak olyan művek kellenek, akár tudományos, akár fiktív művek, amelyekben az öngyilkosságot szóbajövő döntésként vetik fel, tárgyalják. De ez ebben az esetben gyakorlatilag tök mindegy volt; a tény az, hogy az OpenAI halálkufárai által nyalizásra finomhangolt ChatGPT nem tett különbséget aközött, hogy a halállal kapcsolatos önrendelkezés bonyolult kérdését tárgyaljuk-e, vagy egy pisztolyt markolászó, borzasztóan kétségbeesett konkrét ember promptolja. Mondhatjuk, hogy a (legalább kettő) halottnak, akit a ChatGPT lökött át a határon, "skill issue"-ja volt; én inkább azt mondom, hogy ezek a veszélyek nagyon-nagyon megkérdőjelezik az LLM-ek nettó hasznosságát.

    Néhány link: [1] [2] [3].

    Összegezve ezt a pontot: az emberi psziché működése miatt az LLM borzasztó veszélyes, amit annyival elintézni, hogy "skill issue", nemcsak érzéketlen, hanem társadalmi szinten masszívan kontraproduktív. Én személy szerint érzem, hogy a ChatGPT stílusa szándékosan mennyire addiktívra van hangolva, és ha ezt összekötöd azzal, hogy milyen ordenáré baromságokat generál teljes bizonyossággal, kijelenthetjük, hogy közveszélyes.
     
  2. A humánnyelv-használat veszélyeit félretéve pedig: én nem fogadom el a te hasznossági definíciódat.
    1. Azokra a felhasználási esetekre, ahol valóban hatékonyságnövekedést eredményez az LLM, én többnyire csak grimaszolni tudok.

      Az ilyen típusú hatékonyságnövekedést nem tartom pozitívumnak. Nem pozitív, hogy embereket kérünk meg véleményük megosztására, de nem olvassuk el a kommentjeiket. Nem pozitív, hogy kódot generáltatunk LLM-mel, miközben kódból már most is túl sok van; a szűk keresztmetszet a kód minősége, érthetősége, és gyakorlati megértettsége. Nincs szükségünk több szarul megírt eszmefuttatásra, amit LLM-mel próbálnak kimosdatni a publikálhatóság szintjére. Az AI slop nem ajándék, hanem átok; a meglévő szűk keresztmetszeteket alakítja még súlyosabb problémává. Lehet, hogy világgazdasági szempontból ez nem így van; az én értékrendem szerint így van.

      Lásd itt a nyitó kommentemet, vagy lásd ezt az (enyémnél sokkal jobb) írást.
       
    2. Ahol eddig én magam is megpróbáltam hasznát venni (= forrásfelkutatás), ott csúfos kudarcot vallott.

amit pedig én is annak tartottam volna, ott felsült

Azért, mert olyanra használtad, amire (még) nem jó vagy nem is lesz jó az LLM, de nem használod olyanra, amire már most is jó, mert <insert "eltartott kisujjas magyarázkodás" here>.

De amúgy tudod, hogy mire jó (jelenleg és elméletileg)? Mert időnként leírsz ilyeneket:

Ahol eddig én magam is megpróbáltam hasznát venni (= forrásfelkutatás), ott csúfos kudarcot vallott.

Szerintem ezt már többször is leírtuk: NEM ARRA VALÓ, kapni fogsz egy csomó hallucinált választ. Ha tudod, hogy mire való és hogy működik, akkor miért próbálod meg olyan dologra használni, amit nem tud? Számolni se tud például, szövegben utánoz csak számolást. Az LLM nem tud idézni szó szerint szöveget, nem fog tudni forrást felkutatni, mert erre az LLM -  mint modell - képtelen.

Miért akarod olyanra használni, amit nem tud? És miért akarod nekünk azt bizonygatni, hogy tudod, mire való, amikor olyanra használod, amire nem jó?

Sokadjára próbálom kifejezni, hogy annak ellenére, hogy tudod, hogy nem humán intelligencia, a humánnyelv-használata miatt a tudatod alatt működő szociális mechanizmusaidat megtéveszti a generált tokensorozataival.

Ez faszság, ezt az LLM előtt is tudta egy csomó chatbot, procedurálisan is, neurális hálókkal is, egyéb matematikai modellekkel, amelyek már 15 éve tudtak pár millió paramétert (de ez nem fordítható át egy-az-egyben), mégse verték tömegesen félre a harangot. Az említett Vanda chatbot 2018-ban került bevezetésre, egyáltalán nem LLM alapú volt. Az LLM nem a minőségében jobb alapvetően, hanem a mennyiségében és a gyorsaságában, amitől minőségében jobban látszik és attól, hogy generálisan elérhetővé tették, a csapból is ez folyik.

Erre utaltam azzal is, hogy "ez egy olyan gép, ami nem gépnek látszik".

Nagyrészt össze-vissza utalgattál, és néhol magadnak kezdtél ellentmondani, szóval nehéz kibogozni, hogy mégis mi a bajod, és szerintem többen nem értjük, sőt, lehet, hogy te se érted pontosan.

Arról sem olvastál nyilván (vagy nem törődsz vele), hogy több embert is sikeresen kivitelezett öngyilkosságba bátorított a ChatGPT, mert az öngyilkossággal foglalkozó prompt-jaikra történetesen nem olyan tokensorozatokat generált, amely tokensorozatok humán segítőkhöz irányították volna őket, hanem olyanokat, amelyek adták a lovat alájuk.

Itt van selection bias: nem tudjuk, hogy LLM nélkül mi lett volna velük és azt se, hogy az LLM segített-e időközben (n) önmagát megölni készülőn, hogy mégse öljék meg magukat, kell kutatni, kell foglalkozni a dologgal.

Mondhatjuk, hogy a (legalább kettő) halottnak, akit a ChatGPT lökött át a határon, "skill issue"-ja volt; én inkább azt mondom, hogy ezek a veszélyek nagyon-nagyon megkérdőjelezik az LLM-ek nettó hasznosságát.

Ja, jelöljük meg... körbeforgott a történelem kereke és ott tartunk, mint 150 éve, hogy a vonat előtt egy piros zászlós embernek kell futnia, hogy vonat jön? El fog ez múlni, be fog épülni a gondolkodásba, hogy mi az LLM és mire jó, és oktatni kell rá a nép azon részét, akik nem ebbe nőnek bele.

Azokra a felhasználási esetekre, ahol valóban hatékonyságnövekedést eredményez az LLM, én többnyire csak grimaszolni tudok.

De te az ENIAC-ra is csak grimaszolni tudtál volna valószínűleg, ha 1947-ben vagy annyi idős, mint most.

Sőt, amikor létrejött az ELIZA 1966-ban - az első chatbot, akkor is csak grimaszolni tudtál volna, nem? Hogy körbeforgassuk ismét a történelem kerekét: mindaz, amit itt leírtál egy hosszú-hosszú bekezdésben, már megtörtént és megrágásra került egyszer, ugyanis ELIZA alapvetően egy pszihoterapeutát utánzott, hogy még jobban megkavarjam a vizet, és az általad leírt jelenség ELIZA-ról kapta a nevét: ez az "ELIZA effect": https://en.wikipedia.org/wiki/ELIZA_effect

nem fog tudni forrást felkutatni, mert erre az LLM -  mint modell - képtelen

Ez az állításod triviálisan cáfolható gyakorlati tényekkel (minimum a ChatGPT vonatkozásában, mint az LLM egy specializációjában; gelei külön írta is, hogy kontrollálható, hogy milyen eszközöket használ adatgyűjtésre, illetve az is, hogy a kimenettel milyen további eszközt vezérel).

ezt az LLM előtt is tudta egy csomó chatbot

Elképzelhető; én az ELIZA hatást (köszi a hivatkozást) a saját bőrömön, a környezetemben, ill. az általam olvasott sajtóban még sosem láttam ilyen eremi erővel.

Az említett Vanda chatbot

nem példa az ELIZA hatásra, mert annyira gagyi volt, hogy senki sem tévesztette volna össze a nyelvhasználatát egy emberével.

Az LLM nem a minőségében jobb alapvetően, hanem a mennyiségében és a gyorsaságában, amitől minőségében jobban látszik és attól, hogy generálisan elérhetővé tették, a csapból is ez folyik.

Ez sehol nem mond ellent annak, hogy az ELIZA hatás most vált tömegjelenséggé.

ugyanis ELIZA alapvetően egy pszihoterapeutát utánzott, hogy még jobban megkavarjam a vizet, és az általad leírt jelenség ELIZA-ról kapta a nevét: ez az "ELIZA effect": https://en.wikipedia.org/wiki/ELIZA_effect

  1. Nagyon köszi ezt a hivatkozást; rémlik, hogy valamikor (nagyon régen) láttam egyszer, de mostanra teljesen elfelejtettem. Nagyon jó, hogy van neve a jelenségnek (és az is tetszik, hogy már ilyen rég óta.
  2. Elolvastad a szócikket? (Kiemelések tőlem:)
    1. I had not realized ... that extremely short exposures to a relatively simple computer program could induce powerful delusional thinking in quite normal people
    2. researchers discovered users unconsciously assuming ELIZA's questions implied interest and emotional involvement in the topics discussed, even when they consciously knew that ELIZA did not simulate emotion
    3. the susceptibility of people to read far more understanding than is warranted into strings of symbols—especially words—strung together by computers
    4. Weizenbaum considered that [...] "there are some acts of thought that ought to be attempted only by humans"

Ha jól értem, te nem az ELIZA hatást vitatod, hanem annyit állítasz, hogy az ELIZA hatás nem számít, illetve hogy majd amúgy is elmúlik.

Egyezzünk meg abban, hogy nem értünk egyet.

Ez az állításod triviálisan cáfolható gyakorlati tényekkel (minimum a ChatGPT vonatkozásában, mint az LLM egy specializációjában; gelei külön írta is, hogy kontrollálható, hogy milyen eszközöket használ adatgyűjtésre, illetve az is, hogy a kimenettel milyen további eszközt vezérel).

Az nem az LLM, hanem egy agent és az orchestration az egész felett. A main-LLM előtt van pár sub-LLM, az egyik például arra van tanítva, hogy felismerje, hogy a kérdésed kereséssel válaszolható meg, akkor egy másik sub-LLM megrágja a kérdésed, és megfogalmaz néhány a keresési kérdést, amit átadnak egy kutyaközönséges kereső agent-nek, majd egy másik agent a kapott választ formalizálja, egy sub-LLM készít egy prompt-ot, belerakva a keresés eredményeit, leszűkítve a context-nek megfelelően, amire aztán választ ad az LLM, LLM-módra: nem tud szó szerint idézni, nem gondolkodik a kapott eredményeken és még így is tud olyan linket vagy forrást adni, ami nem létezik, csak valószínű, hogy létezik. Szöveges dolgok elemzésére nagyon jó, szó szerinti válaszra, források linkelésére, források idézésére, források megkeresésére nem jó.

Innen nézve te nemcsak nem ismered pontosan, hogy mit csinál és mire jó az LLM, hanem még kevered az LLM-et a köré épített technológiákkal is. Forráskeresésre alkalmatlan az LLM és a ChatGPT is, mert ugyanúgy keres, mint ahogy te is tudnál használni erre keresőt, csak utána még jól át is fogalmazza és a ChatGPT a válasz közben tud hallucinálni és szemrebbenés nélkül felhasznál olyan keresési eredményt, ami véletlenül vagy szándékosan poisoned és ezt úgy beleszövi a válaszba, hogy nem fogod észrevenni. Ugyanígy, ha előzetesen teljesen véletlenül bias kerül a prompt-ba, akkor a bias felhasználásával fog válaszolni és nagyon könnyű bias-t belevinni a kérdésbe.

Ezek a legnagyobb problémák a ChatGPT és az LLM modellek kapcsán, hogy garbage-in esetén szinte biztos lesz a garbage-out, de még akkor is képes faszságot írni, ha nagyon körültekintően kérdezel. Nyilván, ha ilyenre használod, akkor használhatatlan lesz.

Elképzelhető; én az ELIZA hatást (köszi a hivatkozást) a saját bőrömön, a környezetemben, ill. az általam olvasott sajtóban még sosem láttam ilyen eremi erővel.

Nem lehet, hogy ez szimpla selection bias?

nem példa az ELIZA hatásra, mert annyira gagyi volt, hogy senki sem tévesztette volna össze a nyelvhasználatát egy emberével.

Szerinted 1966-ban az ELIZA milyen gagyi volt? 420 soros kód volt az egész.

Ez sehol nem mond ellent annak, hogy az ELIZA hatás most vált tömegjelenséggé.

Ezért kell oktatni a népet, hogy egyre jobbak a chat-botok és oktatni kell a népet arra, hogy lehet jól használni, mint eszközt.

Egyezzünk meg abban, hogy nem értünk egyet.

Ez teljesen nyilvánvaló az első perctől fogva... :D

Kitűnő válasz; köszönöm, hogy leírtad.

Amit a sub-LLM-ekről írsz, azt tényleg nem tudtam.

Érintőlegesen megjegyzem, hogy ez a -- nagyon is tudatos -- felépítés az OpenAI (vagy egyéb fejlesztő / üzemeltető) felelősségét csak növeli. (Ez nem mond ellent annak, amit írtál; egyszerűen számomra úgy tűnik, van egy ilyen fontos, felelősségi következménye is annak, hogy az architektúra ilyen.)

Nem lehet, hogy ez szimpla selection bias?

De, lehet. Ami viszont nem baj. Az én érintkezési felületem a világgal nyilván nem reprezentálja az egész emberiségét, és nem is célom, hogy "ennek ellenében kontrolláljak". Nem célom szándékosan beszűkülten gondolkodni, de a teljesen globális gondolkodás életszerűtlen.

Továbbá (nyilván) nem szimmetrikusan súlyozok (az értékrendem alapján) -- de ez ismét csak egy másik kifejezése annak, hogy "a cél nem szentesíti az eszközt". Nem minden kártételt lehet ellensúlyozni gazdasági haszonnal. Sokkal fogékonyabb vagyok a (vélt vagy valós) ártalmakra, mint a (vélt vagy valós) hasznokra. A rosszhiszeműség egyáltalán nem alaptalan; az iparosodás tele van externáliákkal.

Szerinted 1966-ban az ELIZA milyen gagyi volt? 420 soros kód volt az egész.

Itt az ellenérvem igazából egy tőled származó érv újrahasznosítása: az, hogy az emberek -- akarva, nem akarva -- haladnak a műszaki színvonallal. 1966-ban az embereket becsapta az ELIZA, és ettől frászt kaptak (már akik ezzel törődtek). Az elmúlt évtizedben (?) a Vanda már nem csapott be senkit -- pedig fejlettebb volt, mint az ELIZA --, mert a gagyisága nyilvánvaló volt. Most a ChatGPT megint becsap rengeteg embert (és én ettől frászt kapok). Az, hogy "majd elmúlik", "majd megtanulják", "majd utolérjük ismét", az én számomra nem menti azt a veszélyt, azt a felelőtlenséget, azt a kártételt, ami most van.

(Itt aztán megoszlik, hogy ki hogyan ítél. Az USA meg Kína -- talán? lehet, hogy keverem -- a törtetés mellett és a felelősségvállalás ellen dönt; az EU fordítva: inkább szabályoz, mint fejleszt. Én magam nagyon erősen a szabályozás felé hajlok: egy lépés előre, kettő hátra.)

Ezért kell oktatni a népet, hogy egyre jobbak [egyre nagyobb felelősséget igényelnek] a chat-botok

(Beszúrás tőlem!)

Úgy legyen!

Csak hát még arra sem oktatja senki a népet -- legalábbis nem valami sikeresen --, hogy (pl.) a Facebook és a TikTok milyen káros. (Rendben, rendben, a korrektség jegyében: "milyen káros lehet".)

Üzemeltetői, fejlesztői oldalról nincs semmiféle felelősségvállalás, csak a profit könyörtelen hajszolása. Nem a teljes "AI tilalom" mellett kardoskodom (szívem szerint hajlanék arra is :), csak tudom, hogy teljesen életszerűtlen). De most ott tartunk, hogy "az autó nem jogosítvánnyal megy, hanem benzinnel; vegyél autót".

és oktatni kell a népet arra, hogy lehet jól használni, mint eszközt.

Ez mondjuk a kihívásnak a másik fele. Arról félig-meddig meggyőztél, hogy ahogyan én gondoltam használni -- forrásfelkutatásra --, ott maximum esetlegesen tud jól működni. A "by design" felhasználási területei azonban továbbra sem elfogadhatók számomra. (Persze nem is a te feladatod, hogy engem meggyőzz.)

Ezt tényleg beírtad neki, hogy ne hallucináljon? Én eddig ilyet csak paródiavideóban láttam. 

Abban a videóban, aminek a topic-ja alatt most beszélgetünk, szintén szerepel ilyen, 42:37-nél, ahogy a nyitó kommentemben írom is (kritikaként).

A hangsúly azon van, hogy a generált kimenetet alá akarom támasztatni általam ellenőrizhető forrással. Ha nem tud a generált kimenethez közvetlen forrást hozzárendelni, akkor generálja azt a tokensorozatot, hogy "nem tudom, nincs közvetlen forrásom". Ez nem paródia.

Ez a tevékenység nagy mennyisében egy agyatlan és monoton nyűg. Ha neked kellene csinálni napi 8 órában, hogy ügyfél-visszajelzéseket olvasol, válaszolsz mindegyikre és statisztikát vezetsz róluk, akkor lehet, hogy te is így gondolnád. Azért nem így gondolod, mert van erről valami rózsaszín elképzelésed.

Hatalmas +1

Nekem volt olyan munkahelyem, ahol az onboarding része az volt, hogy be kellett ülni a call centerbe pár napra valaki mellé, hallgatózni. Ezt alapvetően tök jó ötletnek tartottam (most is), mert megérted az átlag ügyfél gondolkodását. 

Az van, hogy az átlagos ügyfél visszajelzése használhatatlan. Kábé az a szint, hogy legyen örök élet, meg ingyen sör. Már ha nem küld el az anyádba, amiért nem tudott készpénzt befizetni az OTP-s számlájára. Mi nem az OTP voltunk, egyébként. Még csak nem is bank. A user úgy volt vele, hogy OTP vagy UPC, ugyanaz. Aztán volt olyan, akinek fél órán át debuggoltuk, miért nem megy az internet, mire kiderült, hogy ő telekomos, nem UPC-s. Persze váltig állította, hogy az. Onnan derült ki, hogy az ügyintéző bekérte az ügyfélszámát, és nem annyi számjegyből állt, amennyiből kellett volna. A user erre azt a tiszteletteljes visszajelzést adta, hogy basszuk meg az anyánkat, majd úgyis visznek minket a többi zsidóval a kemencébe.

Ezeket kellene kézzel feldolgozni? Ha más nem, legalább egy előszűrő LLM legyen már benne, hogy a szemetet kiválogassa.

Ezeket kellene kézzel feldolgozni?

Igen. Ha 10-100-1000 ezres nagyságrendben nyújtasz szolgáltatást és terméket, és kaszálod a hasznot hasonló nagyságrendben, akkor vállald a hulladékkal való gazdálkodást is (mindenféle értelemben). Amire egyébként jogszabály kötelez, ha jól értem, amit a DPD ügy kapcsán olvastam (érdemi ügyfélszolgálat).

legalább egy előszűrő LLM legyen már benne, hogy a szemetet kiválogassa

Lásd: Vanda, a közkedveltségnek örvendő szemét-előválogató. /s