Csoportos keresetet indítottak a GitHub Copilot-ja ellen

Címkék

Csütörtökön két "J Doe" felperes csoportos keresetet (class-action suit) nyújtott be a GitHub Copilot szolgáltatása ellen:

Pert indítottunk a GitHub Copilot ellen, egy mesterséges intelligencia-termék ellen, amely példátlan nyílt forráskódú szoftverkalózkodáson alapul.

A beadványt a Software Freedom Conservancy tizennyolc hónapos előkészítő munkája előzte meg.

A pernek saját weboldala és Twitter csatornája van, ahol az érdeklődők szorosan nyomon követhetik a történéseket.

Ma csoportos keresetet nyújtottunk be a Kalifornia állambeli San Francisco szövetségi bíróságán egy valószínűleg több millió GitHub-felhasználóból álló csoport nevében. Megkérdőjelezzük a GitHub Copilot (és egy kapcsolódó termék, az OpenAI Codex, amely a Copilotot működteti) jogszerűségét. A keresetet az alperesek egy csoportja ellen nyújtottuk be, amelybe a GitHub, a Microsoft (a GitHub tulajdonosa) és az OpenAI is beletartozik.

 

Az SFC bejelentése itt olvasható.

Hozzászólások

Az ilyenek miatt nő továbbra is Kína előnye. A géprombolók korát idéző maradiág, a fejlődést visszafogó jogászkodás miatt. A nyugati világ saját ideológiájának fogja lett. Helyet cserélt a kommunizmussal. Ráadásul amerikai egyetemeken borzalmas légkör alakult ki. Rá sem merek már nézni egy szimpatikus hallgatólányra, meg egyébként is lehet akár társadalmi-transz-dupla-drag-férfi is. Még a wc választás is abszurdba ment át. 

Most azt gondolod, hogy kinaban nincsenek ilyesmik, ugye? dehogynem.

Kezdjuk rogton a legkezenfekvobb 'zero covid' politikaval, de meg hosszu am a sor. Akarhova mesz, bele fogsz futni hulyesegekbe. Egyszeruen az emberek hulyek. Nem csak nyugaton, mindenhol. Csak nyugaton mar ismered oket.

Ha valahol epp kevesbe hulyek az emberek, azt ugy hivjak, hogy "aranykor". :/

Ez a Copilot szerintem inkabb szar, mint jo,

DE

baromira nem tetszik, hogy nem a piacon, hanem a birosagon picsogva akarjak "legyozni".

Bezos elmehet a búsba. Csak egy helyzetbe került szerencsés hülye, semmilyen saját víziója nincs a saját irtdatalan vagyonával kapcsolatban. Másolja ilonkát, ha neki van rakétája, nekem is lesz. Meg valaki súgott neki az Amazon Cloud-al kapcsolatban. Rohadt sok pénze volt és rá tudták venni, hogy vegyen egy rahedli vasat és adja ki bérbe.

mivan ???

 1849. augusztus 13-án tette le a fegyvert Görgei Artúr I. Miklós orosz cár hadserege előtt.
 1945. augusztus 14-én Japán kapitulációja - 1945. szept. 02. A II. világháború vége (kapitulációs okmány aláírása)

Azt tényleg elcseszték, hogy nem figyeltek a konkrét licenc típusra, így vissza tud adni egyértelműen gázos kód részletet, van már pár példa a neten. A fentebb linkelt többi ebben próbál különbözni, illetve az OpenAI is épp dolgozik az új verzión ami a részlet eredetére is tud utalást adni. De azért ez tényleg felvet sok kérdést. Ha amúgy elérhető a kód, én mint programozó elolvashatom, tanulhatok belőle? És ha évek múlva egyszer hasonlót írok mert előszedi az agyam, de a franc emlékszik hogy ez most saját találmány e vagy csak megragadt, akkor licencet/szabadalmat stb sértek? 

Te ugye language- és API reference dokumentumon kívül soha semmit nem használsz programozás közben? Külső lib-et sem, csak ha magadtól álmodtad meg hogy létezik ilyen és szigorúan szemmel verted a kódját, Google használata szégyen kategória. Az még belefér, hogy algoritmusokat nem maga talál fel az ember, hanem szigorúan saját lábán elmegy könyvtárba papír alapon utána nézni? :)

A hőskor elmúlt, cserében gyorsan lehet szemetet megoldást szállítani.

Te ugye language- és API reference dokumentumon kívül soha semmit nem használsz programozás közben? 

Így igaz. Kiegészítve, hogy a forráskódját is megnézem.

Külső lib-et sem

Használok, de annak is csak a doksiját vagy a forrását nézem.

És így Guglizok:

valami keresése site:learn.microsoft.com OR site:github.com

A mathoverflow-t szoktam még használni amikor 2D vagy 3D grafikai tudásomat kell bővíteni. 

A stack verzióját nem szeretem. Semmi olyan tudást nem ad ami ne lenne benne a dokumentációkban vagy a forráskódokban. A legnagyobb bánatom az indiai programozók idióták, akik csoportosulnak és 1 beír valami szart, 200 másik meg felpumpálja. Meg olyan blogokat írnak aminek a 99%-a hogyan telepítsd a fejlesztő környezetet, 1% meg a dokumentációból másolt.

Veled kapcsolatban semmit nem gondolok, és hiába NAGYZOLSZ, átlag pistike nyílt forráskódú szoftverkalóz, kivéve ha a programja tele van hivatkozásokkal a szerzőre, a szerző nevére, és mindenhol ott van a programjában hogy CC BY-SA 4.0

De Te ehhez jobban értesz, mint mindenhez is. Pistike hatékony és szoftverkalóz.

Semmi olyan tudást nem ad ami ne lenne benne a dokumentációkban vagy a forráskódokban.

-1

Én pont azért a tudásért megyek oda, ami nincs benne a doksiban. Általában ez a workflow:

  1. Megcsinálok valamit a hivatalos infók alapján
  2. Lesz valami fuzzy, nehezen meghatározható probléma ("lassú", és hasonlók)
  3. Stackoverflow-n találok egy elrejtett kommentet, amiben valaki megírja, hogy milyen dokumentálatlan tweakelés kell ahhoz, hogy normálisan működjön az a szar, amiből várat kéne építeni

Ja, hát nyilván abban igazad van, hogy az nem célravezető, hogy vakon kimásolod az legtöbb upvote-olt választ.

Érdekes a -1, miközben Te használsz "szart" amiből várat építesz. Ami nem dokumentált, de ha ezen a stackoverflow segít, akkor legyen az. Nem azt mondom hogy rossz, de pont ez a topik az ami arról szól hogy "nyílt forráskódú szoftverkalózkodás". Nem állítom hogy így van, de azért elég nagy százalékban fogadnék arra hogy a várad falaira nem vésted fel a szerzők nevét, forrását, ahonnan kimásoltad. Sokan odavannak érte és másolgatnak üzleti célra, de vajon mennyi vállalati szoftver büszkélkedik azzal hogy nézd mennyi szerzője van a szoftveremnek? Innen másoltam a kis vagy nagy részét: Stackoverflow. :-)

Kaptál tőlem egy +1-et azzal a zárójeles megjegyzéssel, hogy ezek szerint a 21. század eleje úgy fog bevonulni a technikatörténetbe, hogy ez volt az a pillanat, amikor a szoftverfejlesztés színvonala elérte az építőiparét. :-D

A (fizetett) IT-s karrierem úgy kezdődött, hogy első héten a rendszerneve-dev-teszt1 nevű gépre deployolt buildem leállította a teljes ügyfélszolgálati rendszert. Mint később kiderült, a cégben nincs sem rendszerneve-dev-teszt2, sem rendszerneve-prod nevű gép. A gányolást nem most kezdtük. :)

Az én fizetett karrierem úgy kezdődött, hogy az általam írt szimulációs program leállította egy nagy magyar egyetem bérszámfejtő rendszerét.

Hogy utóbbi mit keresett egy kifejezetten tudományos célokra szánt gépen, arra soha nem született kielégítő magyarázat.

Hol a határ, mikortól másolás? 

a=0

Hogy keressem meg ki írta le ezt először az életben? A stackoverflow biztos hogy az eredeti szerző? Forrás megjelölésnél ugye az eredeti kéne. És ha ő is csak másolta? Snippet-ek esetén nincs külön licenc megjelölés, keressem meg a feltöltőt és kérjek engedélyt?

Ez azért így elég életszerűtlen lenne

a jogi oldalat hagyjuk, a kod snippetek erteke onmagaban amugy is kvazi 0, mivel context es hattertudas nelkul csak szar-varat epiteni jok.

az viszont teny, hogy rengeteg minden nincs rendesen dokumentalva. en meg a spring-et is nekialltam debugolni tobbszor is, mert egyszeruen hianyos a doksija. ez van. kicsit is kevesbe mainstream-et szeretnel, akkor mar lib kodot fogsz olvasni.

Jo, hogy te ilyen profi vagy, az IT Chuck Norrisa, de nekunk halandoknak jol jon a tobbiek segitsege. Nekem a doksi olyan, mint a KRESZ, meg az auto gepkonyve, ez jo kezdes, de idonkent jon olyan dolog, amikor kivancsi vagyok, hogy masok hogy oldjak meg.

Szerintem nem szegyen, es nem szanalmas, ha az ember kepes masoktol tanulni.

Nem leegyszerusitem, hanem egy konkret eseteol kertem allasfoglalast  De alabb Gelei megvalaszolt, a fair use -ba tartozik, amivel teljesen egyet tudok erteni.

Meg sosem lapatoltam ki kodot a SO -rol, igy a licensz vonzat az en esetemben eleg mondvacsinalt. Ihletet sokszor meritettem, forumbeli tanacsokat is megfogadtam, de lopni nem loptam. A "for helyett while" meg a "x helyett y kapcsolo" meg a "sed helyett tr" meg a "hasznald a tac, rev parancsot" kategorias dolgok, tanacsok eseteben a licensz eleg agyuval verebre kategoria. Foleg, mert a kodjaim 95%-a egy internettol elzart bugyorban futnak, sokszor meg a sajat nevem sem tuntetem fel, mert nincs (az elmult 7 evben egyszer sem volt) jelentosege.

Szerintem a korrekt az lenne tolem, ha kuldenek a SO kozossegnek egy rekesz sort, koszonetem jelekent.

a licensz eleg agyuval verebre kategoria

Itt ugye az a trükk, hogy a SO nem a kódokat licenceli, hanem a teljes kontentet. Ha egy crawlerrel leszedem, és csinálok belőle egy kategorizált, strukturált KB-t, akkor teljesen jogos elvárás, hogy azt ne tudjam szó nélkül zsebre tenni.

Ugyan erről szól a per, ami a topik indító. A per mellékletben kifejtik hogy mi a probléma a források felhasználásánál. Licenc. Ha a programot MI betanításra használod, az is felhasználás, a céged pedig rajtad keresztül bűnös, ha szemet hunynak a szoftver lopás felett.

És ezzel mi a gond? Feltüntetjük. Így is százával hivatkozunk mindenféle open source forrásra. Ezek nem ördögtől való dolgok. Ha closed source library-t használunk, annak is elolvassuk a licencét, most miért a Stack Overflow-n pörgünk?

Egyébként van enterprise Stack Overflow instance-ünk is, nem irtani kell a külső források használatát, hanem támogatni, és keretek közé helyezni.

Kinek a nevében beszélsz? Egyébként a feltüntetés kevés lesz:

https://creativecommons.org/licenses/by-sa/4.0/

You are free to:

  • Share — copy and redistribute the material in any medium or format
  • Adapt — remix, transform, and build upon the material for any purpose, even commercially.

The licensor cannot revoke these freedoms as long as you follow the license terms.

 Under the following terms:

  • Attribution — You must give appropriate credit, provide a link to the license, and indicate if changes were made. You may do so in any reasonable manner, but not in any way that suggests the licensor endorses you or your use.

  • ShareAlike — If you remix, transform, or build upon the material, you must distribute your contributions under the same license as the original.

No additional restrictions — You may not apply legal terms or technological measures that legally restrict others from doing anything the license permits.

trey @ gépház

Ezen ne múljon, megkérdeztem neked egy jogilag nálam sokkal műveltebb havertól, kb. ezt érdemes tudni ezt értettem belőle:

  • ha van egy konkrét implementáció egy feature-re, és azt copypaste-eled, akkor BY-SA
  • az, hogy van egy két soros snippet, meg melléírva egy másfél mondatos komment, és az alapján módosítasz valamit a saját programodon, az nem issue
    • van egy "észszerű"/fair use mennyiség, ami alatt nincs joghatás, de ez nyilván szubjektív
  • "common knowledge"-re (bármi is legyen ennek a szakszerű jogi definíciója) nincs copyright, ergo attól, hogy valahova megírták kommentben, hogy for (int = 0; i < len(items); i++), attól még nem kell fosni a pereskedéstől

De azért tartanak a cégek jogászokat, hogy az ilyeneket megoldják helyetted. Én csak annyit mondtam, hogy nem megoldhatatlan kérdés ez, legfeljebb nem én fogom tudni megoldani helyetted, hogy X projektbe Y snippetet bemásolhatod-e.

Pedig hatékony. 😊

1. A programozók csak keresnek, majd sorban állnak a főnök irodája előtt linkekkel a kezükben, átadják. A főnök pedig viszi a linkeket a jogász csapathoz. A jogászok pedig órákat töltenek vele hogy mi éri meg jobban, pereskedni vagy feltüntetni a szerzőt.

2. Goto 1.

Normális helyen ezt nem így szokták, hanem pl. van egy lista, hogy milyen mainstream licenceknél mehet a copypaste, melyikhez kell review, és melyik az abszolút tiltott. Emlékszem, az évfolyamunk nagy része azon visítozott, hogy mIéRt KeLl EgY InFoRmAtIkUsNaK jOgOt TaNuLnIa???? Hát ezért, ami ebben a threadben zajlik :D

Nincs szükségem segítségre hogy programozzak, ha új dolog jelenik meg, akkor elolvasom a dokumentációt és megnézem a forráskódot. 

Nem fogok neveket forrásokat és licenceket hozzáfűzni a programjaimhoz mert benned kétségek merülnek fel. De ettől Te még használhatod. A Te döntésed.

Tudok programozni, csöppet sem izgat a SO.

Igy van. A stockoverflowos kommentekbol baromi sokat lehet tanulni. Tipikus hasznalatom, hogy van valami problema, megoldom, de erzem, hogy nem elegans.

Megnezem a stackoverflowon, latok ra egy inspiralo masik megkozelitest, (mittudomen, for ciklus helyett readarray) aztan tovabb olvasom a commenteket, es ott van egy figyelmeztetes, hogy bizonyos csillagallasnal johet egy nem vart eredmeny.

A stackoverflow nagy elonye, hogy a bonyolultabb peldakodokat sokszor el is magyarazzak, igy igazabol megertest ad, nem pedig nehany sor copy-pastelheto tartalmat amit a hajadra kenhetsz. Ami kodot pedig megertettem (nem megtanultam, hanem megertettem!) azt a kodot miert ne hasznalhatnam, ertelemszeruen adoptalva az en programomhoz?

mondjuk ez kenyes tema, mert pont az egyik fontos eleme az egesz oss mozgalomnak, hogy a forraskod legyen szabad, hogy mindenki jobb kodot tudjon irni, tudjon tanulni. Ezekkel a perekkel pont, hogy ezt a kozponti elemet tamadjak sajat OSS megmozdulasuknak.

a licensz csatolas minden snippethez nevetseges, hiszen azt gyakorlatilag mindig customizalni kell a felhasznalashoz. gyakran alig marad belole valami. ertem, hogy elvileg meg mindig copyright, mert abbol indult ki a developer, de ez kezd a patent trolling-ra hajazni.

Ez a per nem egy aktivista pista péntekről hétfőre megírt, gyere csatlakozz mert eladták alólam a szoftvert, amin a közösség dolgozott. Másfél éves előkészülettel támadják meg a multikat, (még csak egyet) hogy tartsa be azt a szabályt, amit ő is betartat másokkal. Ráadásul nem csak megengedő, írd meg ki vagyok és csatold a licencet típusú dologról van szó, hanem olyan licencekről is, ahol vissza is kell adni a forrást. Ez itt nem egy fOSS talicska per. Ez az egész MI jövőjét megváltoztatja, és ott lesz a GitHubon az OpenAI forrás és adat, az a sok petabyte, vagy még több adat, és amit nehéz lesz letölteni, használni átlag felhasználóknak, mert se tárhelye, se gépe nem lesz rá, de győzni fognak.

De van politikai vonzata is a témának, az a pár politikus aki majd megtiltja, mert másik országok pár politikusával szemben ez biztonsági kockázat, egy ilyen tudást átadni. Így nem fognak győzni. Vagyis nem úgy ahogy szeretnének.

Az emberiség pedig csak robotol tovább és másolja illegálisan a programokat. Akik ugye bűncselekményt követnek el mert nem állnak a törvény felett. Nehéz dolgok ezek.

Nem olvastam a keresetet, csak a bejelentéseket, de ez az évtized pere, ha nem nagyobb. Több olyan terméke is van az OpenAI-nak ami perelhető. A nyelvek közötti fordítást is az interneten talált szavak trillióit használták fel, ami ugyanúgy perelhető. Kiadók, bloggerek, bárki, még a HUP is perelheti. Meg ki tudja még hogy melyik terméke perelhető.

Azért vannak bennem kérdések, azzal kapcsolatban, hogy azok a cégek, akik fizettek a szolgáltatásért, szoftver fejlesztésre vagy javításra, vagy akármire is használták, azokkal mi lesz? A bíró kikéri az ügyféllistát és kötelezik őket, hogy azt a szoftvert is tegyék szabaddá? Vagy azokat a részeket? Ha megnyerik a pert?

Egy biztos, nagyon jól időzítették a bejelentést, biztos keveset aludtak a hétvégén a Microsoft ügyvédek.

"Ha valamit nem tudsz legyőzni, állj az élére ..."

A Microsoft megcsinálta. Kíváncsi leszek mi lesz a vége.

trey @ gépház