Feldühítette a felhasználókat a StackOverflow az OpenAI partnerséggel

Egyes StackOverflow (SO) felhasználók az OpenAI-val kötött partnerség feletti elégetlenségüket kifejezendő elkezdték törölni válaszaikat a SO-ról. A moderátorok ezt észleve pedig elkezdték ezen felhasználók fiókjait felfüggeszteni ... A nicCraft megemlíti, hogy a "right to forget" jog nem alkalmazható itt a felhasználók részéről a kommentjeikre, mert azt a felülírja a SO Terms and Conditions (Általános Szerződési Feltételek) dokumentuma, ami speciális jogokat ad az SO-nak a válaszok megőrzésére. Viszont az egyes, különálló postok visszaállítása mentésből nehéznek tűnik.

Hozzászólások

A SO-nál nyilván bevédték magukat jogilag, övék az összes tartalom, és azt csinálnak vele, amit akarnak, és aki oda írogat, az ezt tudomásul is vette. Vagy valaki naivan azt hitte, hogy ő szeretetből generál nekik tartalmat, a SO meg szeretetből hostolja azt?

Akár be se kellett volna jelenteni ezt a partnerkedést. Így várható volt, hogy lesz egy kis vihar a biliben. Aztán majd minden megy tovább. A Redditen is volt hasonló, és még mindig elég sokan generálnak oda tartalmat.

Még mindig jobb így az OpenAI-nak, mint a zavarosban halászni, és engedély scrape-elni mindent, amit érnek. De azért rájuk még mindig haragszom, hogy túl korán a világra eresztették ezt az LLM átkot.

Alapveto felreertes sokaknal, hogy ha 'az van a terms & conditions -ben', akkor az ugy van.

Mondani mindenki mondhat, amit akar; hogy igaz-e vagy sem, illetve hogy tudatosan hazudik-e vagy csak hulye, az meg egy masik tortenet.

Jelen esetben, irhat az SO a T&C-be kvazi amit akar, a torvenyek felette allnak. Mivel a T&C-t tipikusan USA -ra igazitjak, kvazi megszokott, hogy az EUs torvenyekkel utkoznek.

Ha USA-beli ceg EU piacon akar szolgaltatni, akkor az EUs jogszabalyoknak meg kell felelnie, tehat nincs ilyen, hogy mivel kaliforniai az SO, rajuk nem vonatkozik a GDPR. Ahogy ha a te EUs ceged az USA-ban akar szolgaltatni, akkor le kell kezelnie a DMCA requesteket, kulonben kiebrudaljak.

A GDPR pedig nagyon durva dolog. Teszem azt, a forum nick-et personal data, mert azonosit teged, mint szemelyt. Ha barki a forumodon egy valaszban vagy csak ugy meg-taggel, akkor az a GDPR hatalya ala esik.

De a copyright law is masmilyen EU-ban, es bar ezt nem ismerem melyebben, de nem lennek meglepve, ha kiderulne, hogy EU citizen-kent bizony ki kell(ene) torolniuk a hozzaszolasaidat is, ha azt kered, mert hiaba van barmi a T&C-ben, azt az EU copyright law-ja felulirja.

Szerintem baromságot beszélsz. A GDPR-nek ehhez semmi köze. Ha igaz lenne, amit a copyright-ról írnál, akkor Európában nem léteznének fórumok, vagy open source programozás.

Ha én megmutatom neked a T&C-ben azt a pontot, amivel átruházod a tartalom feletti jogot, akkor megmutatod nekem azt a törvényt, ami szerint ez érvénytelen?

Hát, igen. Ezért lenne illő tisztában lenni a szerzői jog és a publikálási jog különbségeivel. Szerzői jogról nem lehet lemondani. Azt viszont ki lehet kötni, hogy a szerző által szerzett tartalmat ki jogosult publikálni. Utóbbit át lehet ruházni és az lehet kizárólagos.

Vagyis, az általad létrehozott tartalom felett a szerzői jogokat gyakorlod (a publikáló köteles a szerzőt feltüntetni stb.), de a publikálási jog pl. egy kiadót illet. Ráadásul, ha a publikálás jogáról úgy mondtál le, hogy a műveddel kapcsolatos összes anyagi bevételről lemondtál, akkor az így járás esete forog fent.

trey @ gépház

Egy T&C polgarjogi tema, hagyjuk a GDPR-t meg tarsait. Egy SO-jellegu oldal tipikusan arra a diszpozivitasra epul, hogy neked peldaul jogod van korlatlan felhasznalasi jogot adni az sajat szellemi termekedhez. Anelkul, hogy a konkret SO T&C-t elolvasnam (ejnye! :)), mernek fogadni ra, hogy ez a kikotes benne van. 

A GDPR-os right to forget nem azt jelenti, hogy van koztunk egy polgarjogi szerzodes, es azt egyszer csak elfelejtjuk. Termeszetesen a szemelyes adataidat toroltetheted, es akkor a hory helyett lesz egy uid_1473 nevu user, vagy ha a tartalmaidban van utalas a szemelyedre, akkor azt is lehet toroltetni.

kicsit keson ebredtek, mar eddig is felhasznaltak a SO tartalmat AI tanitasra, mar 6-7 eve is elerheto volt a db dumpja, NLP tanitashoz nepszeru volt...

Utalom, hogy az AI bassza epp tonkre az internetet es a keresesi eredmenyeket (AI generalt haszontalan SEO optimalizalt tartalom, before:2023 Google flag, stb.).

DE

Nem az a megoldas, hogy elveszed a tudast az AI-tol, azon az aron, hogy a megoldast kereso emberektol is. Aki torolni akarta a kommenteket, meg protestuzenette valtoztatta oket, az nagyobb gyoker, mint barki, aki jot gondol a Sam Altman felekrol.

nincs, es jol latod ez egy eleg komoly problema, igazabol mar evek ota. max annyit tudnak csinalni, hogy csak megbizhatonak tekintett tartalommal(*) trainelik az AI-t, es csak a vegen finetuningkent hasznaljak a mindent is. igy legalabb nem lesz teljesen hulye.

*: pont erre jol a SO, reddit stb oldalak, ahol ertekelik/pontozzak a valaszokat, igy a szemetet konnyu kiszurni.

Vagy a fenymasolat fenymasolatanak a fenymasolatanak a ... fenymasolata.

 

Vagy a pletyka pletykajanak a ... pletykaja.

 

Az internet mar reg elindult a lejton. Az utszeli digitalis hirdetotablak sivar felhomalyaba sullyed, amelyen mellesleg lehet chatelni a haverokkal.

Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

A problema valos, nem toled hallom eloszor, de van par megoldas. Az egyik, ha letezik AGI, aki valodi kornyezetbol sajat adatkat szerez. Itt meg nem tartunk (allitolag), szoval a kevetkezo legiobb dolog a human feedback. A midjourney is tobb kepet general, abbol valasztja ki a user a neki tetszot. Ezzel uj tanitasi adatot ad, megha nem is sokat. A chat alapu rendszerek is kapnak visszajelzest, a beszelgetesek analizisebol lehet latni, mennyire elegedettek a tartalommal. A tozsden evek ota alkamaznak gepi tanulasi algoritmusokat, ott altalaban a profit es a fenntarthato profit a kulcs, de gyakorlatilag egymas ellen versengenek. Az emberi intuicio ott nem sokat segit. 

A szimulalt kornyezetek is hasznosak, es ebbol nem csak fizikai lehet. C++-t is lehet tanulni, csak a hibauzenetekbol. Altalaban viszont van rengeteg szoftvert, amit emberek hasznalnak valos kornyezetben, igy nagyon sok szakertelmet surit. Azon mind hasznalhatoak szimulalt kornyezethez.

Az OpenAI allitolag onnan szerzett uj adatokat, hogy youtube videok hangsavjait irta at szovegge. Hogy miert epp a llama3 a facebooktol a mostani egyik legjobb modell, a grok az X-tol, nekem azt jelenti ok talaltak uj forrast. (Emlekezetes, hogy a twitter megvasarlasakor Musk mennyit ugralt a twitteren levo botok aranyarol).

A problema persze nincs vegleg megoldva, de egy ideje mar vannak valo eletben hasznalt rendszerek, amiknek az eredmenyeit lehet ertekelni. 

> nekem azt jelenti ok talaltak uj forrast

azert a facebooknak elegge sok - es nagyreszt ember altal irt - szovege van, sulyozva (likeok szama, reactionok) amit raadasul web crawlerrel nem nagyon lehet lelopni (probaltam), igy a konkurencia nem fer hozza. raadasul ez emberibb szoveg, mint random cegek bemutatkozo weboldalait meg szepirodalmi muveket tanitani az AI-nak.

googlenek meg ott a gmail :)

Nem az a megoldas

Pedig papíron ez igenis működhet: leveszed a(z) SO-ról, és felrakod valami egyéb helyre, ahol nem sajátítják ki a tartalomra vonatkozó jogot. A megoldást keresőktől meg semmit nem veszel el, mert felteheted máshova a válaszodat. (Ha még linket is hagysz hozzá az eredeti válaszod helyén, akkor csak egy kattintásukba kerül megtalálni.) A valóság persze az, hogy jogosan vagy jogtalanul, de jó eséllyel mindenképpen megszerzik, ami kell nekik, ezzel együtt szerintem a tiltakozásnak van helye, ha valaki azt tartja jónak. (Lásd még: "I Do Not Consent to the Search of this Device" Sticker 3-Pack =) )

 

Stack Overflow announced that they are partnering with OpenAI, so I tried to delete my highest-rated answers.

Biztosan velem van a probléma, de nem találom az indokot.

Ha azt jelentik be, hogy M$, Tesla, PalestinianAI -al társulnak már nyugodtabb lenne? :D

Én azt nem értem, hogy miért pöccentek be az OpenAI-jal kötött partnerségen. Valami TLDR kompatibilis QRD kellene, nem akarok órákat tölteni az utánanézéssel!

Szerintem csak a tipikus utolso csepp a poharban. Evekig epited valakinel a tudasbazist ingyen, amibol o nagyon szepen profital, de elfogadtad, mert neked is jo volt, hogy masok tudasahoz hozzaferhettel. Ha az egeszet becsomagoljuk*, es odaadjuk egy harmadik felnek, de en ebbol nem kapok semmit, az lehet, hogy zavaro nehany contributornak**.

* Igazabol nem tudom, hogy ez tortenik-e, csak talalgatok

** En pl. leszarom, ennel sokkal regebben kiabrandultam mar beloluk

A StackOverflow nekem is sokszor hasznos, pedig csak anoním módon néztem eddig. Úgyhogy szeretem. Azon bepöccenni, hogy valaki ad egy jó szolgáltatást és azon pénzt keres?

Rémlik, hogy 1-2 "botrány" már volt a SO körül, de nem emlékszem mi volt az.

Ami idegesítő benne, hogy a komplexebb kérdéseket - ami majdnem ugyanaz mint egy sokkal egyszerűbb másik kérdés, de hangsúly pont az árnyalatnyi különbségen van - a moderátorok sem értik és duplikátum flaggel letiltják. Ilyet már úgy rémlik láttam, de most nem tudnám elővenni megmutatni. Vagy hogy sokszor a "közérthető" hülyeség van felpontozva a nehezen érthető igazság helyett. De ezek a műfajból adódnak, nyilván nem lehet mindenki mindentudó és hibázik.

Te mi miatt ábrándultál ki belőlük?

Kb azert amit te is emlitettel. Bekuldok egy kerdest, jol osszeszedve, relevans logokkal, erre jon egy faszparaszt, lezarja azzal, hogy duplicate, majd belinkelt egy olyan kerdest, ami 8-10 evvel ezelotti, nemhogy elfogadott valasz nincs rajta, de meg olyan se, ami 0 folotti pontszamon lenne, raadasul nem is duplicate, csak a moderator azt hitte, hogy ez egy XY problema, es nekem is jo megoldas lenne a masik kerdes (nem letezo) megoldasa.

Bekaphatjak. Nyilvan ha kihozza a kereso, elolvasom, de en ebben a sztoriban mar csak ingyenelo leszek.

Eddig a szipi-szupi válaszommal a junior, az indiai copycat meg a kínai rabszolga keresett néhány pennit, most meg majd az aicég az okos ai-t ebből tanítva csilliárdokat, ami elveszi a munkahelyem.

Ráadásul az SO-ra se lehet majd okosakat írni meg egymást szopatni a pontatlan/kidolgozatlan/hiányos kérdések-válaszok lehúzásával, mert az AI jobban/gyorsabban fogja megmondani.

;)

ha az SO csillió dollárért adja tovább amiből a managerek vesznek még egy nyaralót, miközben a posztólok nem látnak belőle semmit, az tényleg fáj

úgy lenne fair ha az SO ingyen vagy csak kezelési költséggel adja tovább, a posztolók is vállalták h ingyenesen publikusan hozzáférhetővé teszik a a munkájukat, beleőlt óráikat

a posztolók is vállalták h ingyenesen publikusan hozzáférhetővé teszik a a munkájukat, beleőlt óráikat

Ők azt kapják cserébe, hogy olvashatják más felhasználók bejegyzéseit.

A cég pedig az ötlet-megvalósítás-fenntartás végett azt csinál a platformon összegyűjtött adatokkal amit akar.

Ők azt kapják cserébe, hogy olvashatják más felhasználók bejegyzéseit.

Ők azt kapták cserébe, hogy nagy nyilvánosság előtt fitogtathatták, hogy mihez értenek, valamit biztos vagyok abban is, hogy egy csomónak szerepeltek a CV-iben. Reklámfelület az önreklámhoz.

+ szórakozás

trey @ gépház

Hogy klasszikust idézzek: "És mégis, ki nem látta ezt előre?" :-D

A baj, hogy az SO megy a sullyesztobe. Mai 2024-es kerdes-valasz mar alig akad.

Egyszeruen elavul. Az aival porgetnek rajta egyet, de mi (kisemberek) szivjuk meg a vegen.

Saying a programming language is good because it works on all platforms is like saying anal sex is good because it works on all genders....

Az a baj, hogy se Californiaban, se mashol nincs az a startup befektetesi kultura, aminek ezeket a 20 eve alapult site-okat koszonhettuk.

Ha a tokevel rendelkezo gazdag befekteto nem fektet semmibe, amiben nincs IoT meg AI meg blockchain, mert "anelkul szar", baszhatod, hogy csinalnal egy jobb redditet vagy egy jobb stackoverflow-t. Az elso spambothaboruban elverzel 100 fos IT hadsereg nelkul, arra meg befekteto penze kell.

Ironikusan a te modszered a jobban mukodok kozt van: emailben irj az adminnak, hogy regisztralnal.

(Amugy en ha milliardos lennek, csinalnek egy olyan kozossegi oldalt, ami blokkol minden Del-Azsiai IP range-et)

ez az emailezos cucc, hup meretben mukodhet, mert lehet napi 5-10 reg. arra meg eleg trey. a so-ra meg naponta regisztralnak annyian mint itt a hupon osszesen vannak. arra meg mar keves lenne egytrey sot, 100 it hadsereg is.

A vegtelen ciklus is vegeter egyszer, csak kelloen eros hardver kell hozza!

A fórum szerű dolgoknak volt egy nagy visszaesése a slack, discord, telegram, stb és facebook csopik megjelenésével.

Én nem hinném hogy menni fog a süllyesztőbe, mert még a hivatalos support fórumok (és dokumentációk? :D) is sokszor jóval gyengébb relevanciájú, szarabb minőségű és rendezettségű infót tartalmaznak.