Már nyíltan akarnak lopni az LLM cégek

Egy hetes hír, az LLM cégek konkrétan azt hazudták Trumpnak, hogy nemzetbiztonsági kérdés, hogy lophassanak.
Google, OpenAI want ‘license to steal’ from publishers with AI proposals

Természetesen hatalmas felháborodást keltett a dolog, és egy valag újabb pert kaptak válaszul a nyakukba. Kérdés, hogy a köztudottan idióta Trump és Musk mit lép erre. Trump képes bedőlni a hülyeségeknek, de Musknak benne van a bögyében az OpenAI, személyes utálat fűti velük kapcsolatban, és mint köztudott, elég nagy befolyása van Trumpra.

Közben a folyamatban lévő perek beérnek, az egyik legelső, amit még 2020-ban indítottak, a múlt hónapban lezárult az LLM cég teljes vereségével. Hogy ez miért lényeges? Mert amerikában precedensjog van, azaz a többi per a legelső per ítéletére fog hivatkozni, és hasonló eredménnyel fog zárulni.

Hozzászólások

...a köztudottan idióta Trump és Musk mit lép erre. Trump képes bedőlni a hülyeségeknek...

Bejelzett a TROLLDETEKTOR!!!!

Mármint a TE esetedben, úgy értetted? Igen, beriaszt rád.

ps: idézet a linkelt oldalról: "...amennyiben a válaszposztra..." és "a feltett kérdésre nem próbál meg válaszolni". Namost gondolkodj el azon, hogy a hozzászólásodnak mennyi köze van a témához, és hogy egyáltalán a TOPIKNYITÓ mennyire lehetne VÁLASZPOSZT, már úgy eleve...

Ezzel megint csak magadat égetted be, TROLL. Persze nem is vártunk tőled mást, LOL.

Trumpról meg hivatásos pszihológusok állítják, hogy egy idióta.

Nem menni az magrot ragzani, mert te lenni ostoba, ugyi?

ámításodnak!!

Ezt nekem írtad, egyes szám második személyben, csakhogy nem is én állítom, hogy Trump egy elmebeteg, hanem számos tanulmány és többszáz hivatásos pszihológus.
President Trump’s Personality
The Mind of Donald Trump - Narcissism, disagreeableness, grandiosity
More than 230 doctors say Trump is too unstable
233 Mental Health Professionals Spell Out Dangers Of Donald Trump
The Dangerous Case of Donald Trump: 27 Psychiatrists and Mental Health Experts Assess a President
...stb.

Megint belesétáltál a csapdába, TROLL. És nem, hivatásos szakvéleményre hivatkozni NEM tekintélyre hivatkozás, még véletlenül sem! Persze egy hozzád hasonlótól nem várom el, hogy megértse.

A továbbiakban nem válaszolok a posztjaidra, főlj csak a saját levedben! Magadnak ástad a sírt.

Csak irigykedik bzt, mert ő csak egy bot, aki nem tud GIT-re regisztrálni! :-D

Bezzeg az AI nagytestvérek azok simán átmennek a bot-szűrőn és viszik az anyagot és jól megtanulják. 

Ha egy embernek joga van bármilyen copyright anyagot elolvasni ha egyszer már megvette és tanulni a tartalmából, akkor egy Ai-nak miért lenne tilos?! Le az AIszemita gyűlölködőkkel, akik meg akarják fosztani mesterséges barátainkat a tanulás jogától! :-) 

“Az ellenség keze betette a lábát”

Ha akarod, bármikor szerzek neked ugyanilyet, amit aláír több ezer pszichológus, csak arról fog szólni, hogy idióta vagy. Tudod, az internet mindent elbír.

Az elnök vagy elmebeteg, vagy annak van beállítva. Egyelőre Elon Musk is elmebeteg, megvette a twittert más pénzén, teljesen szétzilálta, kirúgta az alkalmazottak 2/3-át, és láttuk, hogy össze fog omlani.

Erre aztán csak áll, és működik, jobb AI van alatta, mint a Googlenek ami van (legalábbis nem rajzol néger hitlert), továbbra is a legfőbb hírközlő alkalmazás az USÁban.

De jah, biztosan igazad van, és felnőtt férfiként még hinned kell a mesében. Gratulálok!

De jah, biztosan igazad van, és felnőtt férfiként még hinned kell a mesében

Mondja a TROLL, aki még arra sem veszi a fáradságot, hogy megnézze, Trump első két hónapnyi uralkodása alatt mennyit is esett valójában az amerikai GDP. De persze, én hiszek a mesékben, LOL.
https://fortune.com/2025/03/01/us-economy-recession-outlook-q1-gdp-cont…
Erre mondják, hogy a számok nem hazudnak.

Visszatérve a TROLLgyalázás után a témára, szerintetek mennyi esélye van, hogy Trump mentesíti az LLM cégeket a copyright jogi védelem alól? És ha igen, akkor vajon ez milyen kihatással lesz az általuk kínált szolgáltatás copyright jogaira?

A copyright rendszer úgy van elbaszva Miki egerestől kezdve mindenestül, hogy az csak na!

On the one hand, Disney pushed for the law that extended the copyright term to 95 years, which became referred to derisively as the “Mickey Mouse Protection Act.”

Itt az ideje, hogy végre megreformálják az egész baromságot, hogy ne csak egy szűk, elit kör gazdagodjon abból, amit 100 éve valaki random kitalált, hanem végre az egész emberiség profitáljon a nyílt tudásmegosztásból.

Ugyanezt az érvet a szabadalmakkal szemben is fel lehet hozni. De kötve hiszem, hogy az LLM cégek a szabadalmak eltörlését kívánnák. (Tehát vannak érvek a szellemi tulajdon koncepciója ellen, en bloc. De ebben az esetben nem jóhiszeműségről van szó, amit a nemzetbiztonsági bullshit előrángatása szerintem egyértelműen bizonyít.)

Szerkesztve: 2025. 03. 23., v – 15:12

Mégegyszer, mert egyesek jól láthatóan nem értik, miról van szó. A gyengébbek kedvéért leegyszerűsítem.

Ha elfogadjuk, amit az LLM cégek állítanak (nevezetesen: nem illeti meg a copyright védelem azt, ami a neten van és mindent fair use használni), akkor mi a helyzet magukkal az LLM cégek szolgáltatásaival? Merthogy ugyanezen érvelés mentén akkor a ChatGPT kimenetét sem illeti meg a copyright védelem, ugyebár.

Válaszolhatsz nekem is nyugodtan, nem kell ez a passzív-agresszív, "nem beszélek közvetlen hozzád, de azt azért elég hangosan teszem, hogy te is halljad" feminin attitűd.

Igen, remélhetőleg az LLM-ek kimenete is mentesítve lesz a copyright védelme alól.

Ez az egyik legnagyobb akadálya az LLM használatának céges környezetben. A generált kódot nem használhatod fel a kódbázisban, mert a cégnek fogalma sincs, hogy ki a copyright holder ebben az esetben.

A másik meg a saját IP védelme, de arra talán már van, vagy hamarosan lesz válasza az AI cégeknek (dedikált/lokális szerverfarmon futó LLM-ek, amik garantáltan nem gyűjtik az inputot további training céljából).

Ld. Apple Private Cloud Compute, ami jó irányba indult el:

  • User data stays on the PCC nodes that are processing the request only until the response is returned. PCC deletes the user’s data after fulfilling the request, and no user data is retained in any form after the response is returned.
  • User data is never available to Apple — even to staff with administrative access to the production service or hardware.

https://security.apple.com/blog/private-cloud-compute/

Az ugye megvan, hogy nem mindegy hogy van-e copyright vagy a felhasználóé-e a copyright, mert ez két külön eset.

Ahogy most a helyzet kinéz ez teljesen ország függő, de általában az a helyzet hogy a generált LLM kód felett nincs szerzői jogod. Ez pedig azt jelenti céges szinten hogy ha te a kódodbázisba ilyen kódot használsz, valaki betör, ellopja, majd pedig kirakja az internetre, amit aztán valaki más felhasznál, akkor semmilyen jogalapod nem lesz kártérítésre, hiszen nem volt a fejlesztődé a szerzői jog, tehát le sem mondhatott róla a céged javára. 

Ha viszont az LLM-t felhasználóé a szerzői jog, akkor ez jó, mivel igy a szerzői jog átkerül a céghez, és van védelem.

De ez mind hiába, mert ha az LLM egy olyan forrásból lett tanítva amelynek a copyright-ja nem megengedő, és neked ezt egy az egyben visszaadja, amit te felhasználsz, akkor ugyanúgy jogsértést fogsz elkövetni, kivétel, ha nem tudod minden sor kódra bizonyítani, hogy annak mi a forrása (LLM, fejlesztő saját kis buksija, harmadik féltől átvéve)

 

A napokban volt róla hír, hogy

A federal appeals court in Washington, D.C., on Tuesday affirmed that a work of art generated by artificial intelligence without human input cannot be copyrighted under U.S. law.

link

Mondjuk ezt én nem értem. Mi az hogy "generated without human input"? Csak random elkezdett az AI rendszer képeket generálni? Senki nem indította el a programot, senki nem promptolt?

Vagy itt arra gondolnak, hogy a szerzőnek kell megrajzolnia, megfestenie?

Miben különbözik ez egy fotóstól, aki megkomponálja a képet, de a fotót már maga a Digitális Gép kreálja, gyakran ML/AI segítségével. Akkor egy DSLR-ral, telefonnal készített kép sem esik szerzői jog alá? Miben különbözik ez a kompozíció a promptolástól?

Ha írok egy C programot, akkor annak a forráskódjának a szerzői joga engem illet, de ha kiadom a 'gcc' parancsot, akkor a generált assembly kód már nem esik az én szerzői jogom alá?

Szerintem ugyanez lefutott már egyszer, amikor a keresőmotorok elkezdték felindexelni a világot. Most ugyanaz megy pepitában.

Nem egészen, ugyanis a keresőmotorok
- egyrészt nem készítenek származékos művet az oldalakból, csak indexelnek,
- másrészt ingyenesen hozzáférhetővé tették a keresési eredményeket (legalábbis a legnagyobbak, mint a Google pl. így jogi értelemben nem értékesítették a begyűjtött adatokat, csak a reklámfelületet, ami egész más)

Ezzel szemben az LLM
- a lopott adatokon betanított szolgáltatásaikért copyright jogot követelnek (annak ellenére, hogy ezt a 17 U.S.C. § 101 törvény, de még a saját Terms of Use szabályzatuk is tiltja) és
- pénzt kérnek a használatért (ráadásul pofátlanul sokat), tehát egyértelműen továbbértékesítik a begyűjtött adatokat
- a felhasználás módja pedig nem is csupán indexelés, hanem származékos műnek minősül, így jogilag más kategória (*).

(*) - ez egy darabig vita tárgya volt, a mostani bírósági ítélet döntötte el a kérdést végleg, hogy igen, egy MI által generált tartalom bizony a betanított adatokból képzett származékos mű jogi értelemben.

Viszont:

  • ugyanúgy ingyen jutnak az adatokhoz, hírekhez
  • ugyanúgy pénzt csinálnak belőle
  • ugyanúgy hajlandók a történelemhamisítára
  • ugyanúgy hajlandók nagyjából bármilyen hülyeséget állítani (=megtalálni)
    • jó pénzért ezt még előtérbe is helyezik, lásd történelemhamisítás
  • ugyanúgy manipulálják a keresési találatokat, nem kicsit tolva a szélsőjobbos idióták szekerét (már csak az egyensúly kedvéért)
  • gyakorlatilag az van, amiért elég sokat fizet bárki is (szerencsés esetben mindkét-három-bármennyi oldal egyformán fizet, szóval a platform tulajdonosa lesz kőgazdag, és az az igazság, amit Ő állít - kitalált történet :D)

A történelemhamisítás részhez: emlékszem olyan hírekre, hogy a DeepWater Horizon megdőlése után, és végül meg is találtam, most még kidobja az AI, egy kis noszogatás után, szóval olyan hírekre, hogy BP rettenetes mennyiségű pénzt költött reklámokra, hogy a reputációját helyrehozza. Őszintén szólva fogalmam nincs milyen sikerrel, de ott a tanulmány.

(Az már csak hab a tortán, hogy rémlik olyan híráramlat is, hogy két-három évvel később olyan hírek jöttek, hogy nem is volt ez olyan problémás, virágzik az élővilág, fasza minden, és ugye általában az utolsó hírek maradnak meg a fejekben. De ilyesmit most végképp nincs energiám előkeresni.)

 

Szóval én nagyon-nagyon sok párhuzamot látok. Régen azok haltak meg, akik lovaskocsihoz voltak szokva, és kibotorkáltak az autó elé, most azok fognak, akik elhiszik, amit "az interneten látnak".

És jobban át kellett volna gondolni, de a reggeli kávéba ennyi fért bele.

- egyrészt nem készítenek származékos művet az oldalakból, csak indexelnek,

Az nem származékos mű, hogy rákeresel valamire, és kiteszi egyből a választ a lap tetejére anélkül, hogy neked a valós forrást meg kellene nyitnod (és ezzel mondjuk az ottani reklámokat megnézve bevételt generálnál az alkotónak)?

- másrészt ingyenesen hozzáférhetővé tették a keresési eredményeket

A legtöbb LLM-nek is van free tierje, számít ez a megkülönböztetés?

Nem is értem, ha a locsogóprogram mások munkáiból összeollóz nekem valamit, akkor esetleg nem én leszek jogilag annak a  szerzője?! Ez milyen etikátlan már!

ha a locsogóprogram mások munkáiból összeollóz nekem valamit, akkor esetleg nem én leszek jogilag annak a szerzője?!

De, te leszel a szerzője, ezzel nincs is gond, csak a felhasznált anyagokkal, illetve a locsogóprogram kimenetére támasztott jogi igényekkel van gond.

Megpróbálom röviden összefoglalni, mi a gond ezzel:
- Egyrészről, ha csakis saját kútfőből csinálsz valamit, akkor te vagy a szerző és a kizárólagos szellemijog tulajdonosa, így te szabod meg a felételeket. Ez sima csiga.
- Ha viszont másvalaki munkájára támaszkodva csinálsz valamit, akkor hiába vagy te a szerző, nem csak te szabod a feltételeket, hanem be kell tartanod a felhasznált munkák feltételeit is. Ha például az eredeti szerző nem járult hozzá, hogy a művére építs, és nem is nevezed meg, hogy eredetileg az ő műve, az simán plágium. Ha engedi, de feltételekkel, de te szarsz ezekre a feltételekre, akkor az meg licenszsértés. Mindkettő bűntetendő, utóbbi a Berne Convention értelmében nemzetközileg is (ezt 1988-ban írta alá az USA, így tehát az OpenAi-ra, mint amcsi cégre is vonatkozik).
- Másrészről, amcsiknál törvény mondja ki, hogy a program licensze nem vonatkozhat a program kimenetére, az a felhasználót illeti (például ha te írsz egy regényt Winwordben, akkor hiába a Microsoft-é a Winword copyright joga, attól még a benne írt regény joga mégsem lehet az övék). Az OpenAI most mégis azzal próbál érvelni, hogy a ChatGPT kimenete az ö jogtulajdonuk (pedig hát nyilván nem, ezt még a saját felhasználási feltételeik is kimondják, ráadásul a bemenet sem volt már eleve az övék).

Hát figy... nem állítom hogy borzalmasan sok szakdolgozatot néztem át, de amikor kibassza a szemem, hogy az egyik harmadát innét, a másik harmadát onnét, a maradékot meg amonnét másolta a "szerző", mert még a betűtípus is más, akkor... akkor nem is értem mi a probléma.

(Lediplomázott.)

 

---

Hirtelen felindulásból, koffeinsokk hatása alatt született hozzászólás.

Ha jol ertem, akor arrol vitaznak, hogy az interneten a "lehet-e lopni" es a "szabad-e lopni" lerdesek koze ES vagy pedig VAGY muvelet keruljom.

Mivel teny, hogy a vilag nagy resze a masodik feltetel letezeset csak akkor veszi eszre, amikor a sajat szellemi tulajdona kerul szoba, ezert ezt a dolgot en ugy veszem, mintha torvennyel akarnak megtiltani a politikusoknak, hogy hazudjanak. Elvegre az internet konkretan arra valo, hogy korbelopkodjuk egymast. :-)

Ha jol ertem

Nem jól érted.

akor arrol vitaznak, hogy az interneten a "lehet-e lopni" es a "szabad-e lopni" lerdesek koze ES vagy pedig VAGY muvelet keruljom.

Nem. Nagyon nagyon leegyszerűsítve, azt próbálják állítani, hogy ha ők lopnak az fair use, de ha tőlük lopnak az meg nem fair use.

amikor a sajat szellemi tulajdona kerul szoba

És ismét csak nem érted, az OpenAI-nak nincs is saját szellemi tulajdona, a betanításhoz felhasznált adatokat másoktól lopták. Soha nem is volt az övék, és engedélyt sem kaptak a felhasználásra.

Na es az a 4 dvd nem nagy kaland.

Every single person is a fool, insane, a failure, or a bad person to at least ten people.

Egy másik nézőpont: tegyük fel, hogy te elolvasol több ezer könyvet (olcsón, mert pl. könyvtárba jársz, vagy iskolában ingyen kölcsönadják a tankönyvet), ezek tartalmát nagyjából megjegyzed és okos leszel tőle, és ezután ebből a tudásból meg akarsz nézni, és pénzt akarsz keresni. Na, az AI tanítás is kb. ez.

De hasonlíthatjuk egy netes keresőhöz is. A kereső és az AI is elolvasott nagyon sok weboldalt. A kereső és az AI is képes kivonatolt tartalmat közzétenni ezekből (de nem szóról szóra mondják vissza), összefoglalókat írni, a tartalomból következtetéseket levonni (egy kérésre adott találati oldal összerakásához nem kevés elemzés kell). A kereső és az AI sincs általában ingyen (a keresőkért tipikusan reklámfogyasztással fizetsz, de van teljesen ingyenes is, AI-ból is van teljesen ingyenesen elérhető alapverzió).

Vagy akár egy újságíróhoz is hasonlíthatjuk. Egy újságíró elolvas egy könyvet, megnéz egy filmet, elolvassa másik újságírók munkáját, és ezután ír egy saját cikket, amiből pénzt kap, de abból a pénzből az eredeti művek szerzői nagyon keveset (pl. egy mozijegy ára) vagy semmit nem kapnak.

Egyébként meg mi itt hiába beszélünk róla laikusként, ezt a különböző stakeholderek és ügyvédeik közötti hosszú jogi csatározás fogja eldönteni. Az én tippem, hogy a fenti példákhoz hasonlóan az AI cégek majd egy jelképes összeget fizetnek bizonyos művek használatáért, de utána azt kezdenek az anyaggal, amit akarnak.

Bár elég szűklátókörű és diktatórikus vagy ahogy olvasom, de nem csak a hülyeségeket kellene olvasnod a neten, hanem gondolkodni is kellene mert így nem vagy jobb mint egy egyszerű LLM.

Az AI is egy új fegyverkezési verseny. Ha nem történik valamiféle globális jogharmonizáció vagy szabályozás, akkor a Amerika lemarad Kínával szemben. Kínában ott van tükrözve az egész internet naprakészen. Van miből tanítani az LLM-eket, így a végén a minőség és kapacitáskülönbség a kínai modellek javára dőlhet el.

Kell AI/LLM Fair Use Act, mert ahol az elavult szerzői jog miatt ez nem következik be, az lemarad a globális AI fegyverkezésben.

Az EU-t fel se hozom, mert mire Brüsszelben bármit is döntenek, addigra el megy mellettük a világ, és kezdhetik elölről.

Bár elég szűklátókörű és diktatórikus vagy ahogy olvasom

Látom nem megy a szövegértés, és nem is érted a lényeget.

Kínában ott van tükrözve az egész internet naprakészen. Van miből tanítani az LLM-eket

Nem tudom, ezt honnan vetted, mert nincs. Ennek ékes bizonyítéka, hogy a DeepSeek-et nem is az interneten tanították be, hanem konkrétan a ChatGPT kimenetén.

Kell AI/LLM Fair Use Act, mert ahol az elavult szerzői jog miatt ez nem következik be, az lemarad a globális AI fegyverkezésben.

Tehát szerinted hülyeségeket beszél az OpenAI, amikor a kimenetét próbálja elavult szerzői jogra hivatkozva védeni, hiszen az fair use volt, hogy a DeekSeek desztillálta. Ezt akarod mondani?

Megjegyzem: az OpenAI-nak semmi joga felháborodni azon, hogy desztillálták, mivel a saját szabályzatában is szerepel, hogy a kimenetre nem formálhatnak copyright jogot, és a DeepSeek fizetett az API használatért, így legálisan jutott hozzá a kimenethez.

Látom nem megy a szövegértés, és nem is érted a lényeget.

Nagyon is értem a lényeget. Olyan fajta ember vagy aki elolvas valamit és elhiszi. Olyan dolgokat állítasz és olyan linkeket helyezel el, amitől a tükör előtt állva látod magadon a glóriát miközben büszkén veregeted a vállad. De persze ez is egy álláspont.

Nem tudom, ezt honnan vetted, mert nincs. Ennek ékes bizonyítéka, hogy a DeepSeek-et nem is az interneten tanították be, hanem konkrétan a ChatGPT kimenetén.

A szűklátókörűségnek ez a lényege. Abban a hitben vagy hogy Kínában csak a DeepSeek létezik, mint érvelő modell. És igen, ékes bizonyítéka annak, többféle DeepSeek létezik attól függően, melyik országban használják, információk szándékos eltitkolásával, politikai torzítóként. Boldogok a lelkiszegények.

Tehát szerinted hülyeségeket beszél az OpenAI, amikor a kimenetét próbálja elavult szerzői jogra hivatkozva védeni, hiszen az fair use volt, hogy a DeekSeek desztillálta. Ezt akarod mondani?

Az OpenAI hülyeségeket beszél, amikor a kimenetét próbálja elavult szerzői jogra hivatkozva védeni.

Megjegyzem: az OpenAI-nak semmi joga felháborodni azon, hogy desztillálták, mivel a saját szabályzatában is szerepel, hogy a kimenetre nem formálhatnak copyright jogot, és a DeepSeek fizetett az API használatért, így legálisan jutott hozzá a kimenethez.

Ezt még a hülye is tudja.

Látom, habzó szájjal tobzódnak a TROLLok, akik nem is értik, mi volt a kérdés, és nem is képesek érdemben hozzászólni.

Sajnálatos, hogy ide süllyedt a HUP, mondjuk abban az országban, ahol a miniszterelnök nyíltan Hitlertől és Szálasitól idéz, ez csöppet sem meglepő. (És ha már itt tartunk, aki tanult valaha is iskolában történelmet, az tudja, hogy a "tegyük naggyá megint" szlogen eredetileg Mussolini hívószava volt.) De persze nyilván nem a TROLLok dőltek be a progandaista mesének, hanem mindeni más téved (szarkazmus)

Na, kire riaszt most be a kis TROLLdetektor?

Nem állt szándékomban válaszolni, de meg kell köszönöm ez a kimagasló intellegienciát demonstráló, építő jellegű, témáról szóló, igen intellektuális, sértegetésektől mentes hozzászólást! (szarkazmus)
ps. az ugye megvan, hogy most csak magadat járattad le, és pont hogy nekem adtál igazat a posztoddal? Á, kizárt, hogy felfognád, mit is tettél. Hisz még a topiknyitót sem tudod megkülönböztetni egy válaszposzttól.

Csak a vicc kedvéért heccellek még egy kicsit! :-D

Már a nyitóposztban is TROLLkodtál

Bizonyítsd ezt, ha tudod! Azt ugye tudod, mit jelent az a szó, hogy "bizonyítás"?

Bizonyára elkerülte a figyelmed, hogy Én - veled ellentétben - már alátámasztottam a topiknyitóban tett állításom tényekkel (például, hogy Trump alatt az amerikai GDP +2.3%-ról MÍNUSZ 1.5%-ra zuhant), ellenben te TROLLhoz méltóan semmit sem támasztottál alá, sőt még csak meg sem próbáltad. Érvelés és forrásmegjelölés helyett te csak az elismert pszihológusokat próbáltad - persze eredménytelenül és tök feleslegesen - pocskondiázni, semmi mást nem tettél. Na ezért van az, hogy te az internet legundorítóbb pöcegödrében dagonyázó TROLL vagy, és még véletlenül sem azért, mert valaki (én vagy bárki más) ezt mondja. Quod Errat Demonstrandum.

És csak hogy tisztázzuk, nem várom el egy hozzád hasonló, buta agymosott TROLLtól, hogy felfogja, mit is írtam az imént. Az lenne inkább a meglepő, ha belátnád végre, hogy ha azt nézed csak, milyen ember mondta, na az az igazi https://a.te.ervelesi.hibad.hu/tekintelyre-hivatkozas

Látod? Bármiféle érdemi reakció helyett ennyit voltál csak képes ideböfögni, mivel nem is értetted, amit írtam. Megmondtam én előre, hogy nem is vagy képes felfogni.
(csak helyfoglaló, nehogy kitörölhesd a bizonyítékot a saját butaságodra és alkalmatlanságodra ;-D)

És ebben a hozzászólásodban az állításodra (vagy bármelyik korábbi állításodra) bármiféle bizonyíték, érv, alátámasztás vagy akárcsak forrásmegjelölés hol is van pontosan?

Mindig ez a műsorotok: idepofátlankodtok AZ ÉN TOPIKOMBA, a témához hozzá sem bírtok szólni, mert ahhoz túl hülyék vagytok, helyette csak személyeskedni meg sértegetni próbáltok, de persze az sem jön össze soha, helyette csúnyán beégetlek mindig titeket.

Tudod, veled ellentétben én sosem tagadtam, hogy aki TROLLkodni próbál, azt csúnyán viszont fogom TROLLkodni! Bár igazából most nem is én voltam, mert amilyen hülye vagy, saját magadat járattad le, LOL.

Szerkesztve: 2025. 03. 24., h – 21:02

És ők is bedobják az AI szabadalmaikat a közösbe, vagy az a szellemi tulajdon szent és sérthetetlen?

Teljesen jogos érv, hogy az IP védelem jelenlegi keretei már fékezik az innovációt. De ha a nemzetbiztonság bullshittel akarják a saját pozíciójukat bebástyázni miközben ők semmilyen áldozatot nem hoznak, akkor nehéz jóhiszeműséget, vagy akár jogos érdeket látni a dologban.

Amúgy Steve Banonnal néztem nemrég egy interjút. Mindenki azt gondol a figuráról amit akar, az államkapitalizmusa nekem se szimpatikus. De abban igaza van hogy a nagy tech privilegizáltak voltak, például a monopolellenes törvényeket nem alkalmazták velük szemben. Az egyezség szerinte kb. arról szólt hogy az amerikai kormány hagyja, hogy ezek a cégek kontrollálatlanul nőjenek és a tulajdonosaik a világ valaha volt leggazdagabb emberei legyenek, cserébe ők biztosítják a technológiai fölényt Kinával szemben. De, mint kiderült, az alku rájuk eső részét nem tudták teljesíteni.

És ők is bedobják az AI szabadalmaikat a közösbe, vagy az a szellemi tulajdon szent és sérthetetlen?

Úgy van, ez itt a kérdés!

Teljesen jogos érv, hogy az IP védelem jelenlegi keretei már fékezik az innovációt. De ha a nemzetbiztonság bullshittel akarják a saját pozíciójukat bebástyázni miközben ők semmilyen áldozatot nem hoznak, akkor nehéz jóhiszeműséget, vagy akár jogos érdeket látni a dologban.

Pontosan erről van szó! Ha ők lopnak mástól, az okés, de ha más lop őtőlük, az nem okés? Tényleg nehéz ebben bármiféle jogosságot és jogegyenlőséget látni.

Nekem sokkal inkább ezt a kifacsart kommunista logikát juttatja eszembe: "ami a tiéd, az az enyém is, de ami az enyém, ahhoz semmi közöd!!!" Azt meg tudjuk történelemből, hogy ez a hozzállás zsákutca, csőd, egyenes út a bukáshoz.

De, mint kiderült, az alku rájuk eső részét nem tudták teljesíteni.

Megintcsak +sok! Ráadásul még pikánsabb annyival, hogy a Trumpra nagy befolyással bíró Musk személyesen rühelli az OpenAI-t, nem kis csavartlabdát dobva így az egésznek. Az külön érdekes lesz, ha csak a Musk-féle xAI kapja meg ezt a felhatalmazást, a jelenlegi amerikai piacvezetők meg nem.

Amiket ezerszámra birtokolnak? De nem is csak az AI szabadalmakról van szó, inkább arról, miért pécéznék ki specifikusan a szerzői jogokat mint nemzetbiztonsági kockázatot? Miért nem a teljes IP védelmet akarják megreformálni? Mit adnak ők cserébe? Mert a történelmi precedens, hogy a „nemzetbiztonság” bullshit a hatalmi/pénzügyi érdekek szolgálatában.

hagyjuk mar ezt az AI lopas temat, mert baromsag. ha az ember az iskolaban elolvas egy csomo konyvet, a muzeumokban megnez egy csomo kepet, esetleg meg a filmeket se veti meg, aztan ezekbol inspiralodva alkot valamit, akkor az is lopas? mert akkor MINDENKI is lop.

aztan ezekbol inspiralodva alkot valamit, akkor az is lopas?

Rosszul tetted fel a kérdést. Ha valaki a ChatGPT kimenetén inspirálódva alkot valamit, akkor már az is lopás?
Nem lenne semmi gond ezzel az egésszel, ha az LLM cégek a nagy szabadság követelése mellett nem akarnák közben a saját kimenetüket jogilag védeni. Ha azt mondanák, hogy mindent szabad, beleértve azt is, hogy az ő kimenetüket is szabad másoknak felhasználni, akkor minden okés lenne.

De nem egészen ezt mondják, ugye?

mert akkor MINDENKI is lop.

Nem. Ha a felhasznált művek licenszfeltételeit betartod, és engedélyt kapsz a jogtulajdonostól, akkor az NEM lopás. Civilizált világban ez így szokás.

egyreszt abban egyetertek, hogy nem kene jogilag vedeni az outputot, ahogy pl a deepseek es sok mas model nem is teszi.

masreszt ha egy ember inspiralodva masik muveibol alkot valamit, azt alanyi jogon vedi a szerzoi jog, nemde?

persze sokan (te is) lenezik az ai-t, hogy "az csak egy algoritmus", de a mai modelek (a transformer alapuak) mar nagyon hasonloan mukodnek mint az emberek. en mostanaban rengeteget hasznaltam a deepseeket (a teljes modelt, lokalisan futtatva, nem a distilled szarokat) tech doksik iratasara, es brutalis. megirom par sorban a vazlatot aztan raengedem, ez a best bullshit generator ever! de viccet felreteve, tenyleg megerti mirol szol a tema, vannak egesz jo otletei, es pl. olyanokat is eszrevesz (based on context) ha pl valahol elirtam egy tipuskodot.

> Nem. Ha a felhasznált művek licenszfeltételeit betartod, és engedélyt kapsz a jogtulajdonostól

szerinted 1-1 muvesznek mindnekitol van engedelye, akinek a muveibol tanul, inspiralodik?

szerinted 1-1 muvesznek mindnekitol van engedelye, akinek a muveibol tanul, inspiralodik?

Tegnap este szűk körben én is érveltem, csak a tanárokat hoztam fel, akik átadják a tudásukat.

Miért fizetést kap? Miért nem kap az oktatás alatt diákoktól havonta 10.000 forintot? (az összeg csak példa). A diákok akik sikeresek lesznek az életben, miért nem fizetnek jogdíjat a kapott tudásért az adott tanárnak?

És hasonlók.

Dehát ezek bonyolult dolgok.

egyreszt abban egyetertek, hogy nem kene jogilag vedeni az outputot

A hatályos jogszabályok és a saját ToU-juk alapján ez egyébként nem is lehetséges, az benne a pláne.

masreszt ha egy ember inspiralodva masik muveibol alkot valamit, azt alanyi jogon vedi a szerzoi jog, nemde?

Ácsi! Az inspirálódásra felhasznált művet is éppúgy alanyi jogon védi a szerzői jog, nemcsak az "inspirálódott" művet.

szerinted 1-1 muvesznek mindnekitol van engedelye, akinek a muveibol tanul, inspiralodik?

Szerinted minden tilosban parkoló lebukik? Igen, bizony mindekitől kellene lennie engedélyének (amennyiben a felhasznált mű nem közkincs, és az eredeti szerző explicit nem licenszelte). Ha nincs, akkor az eredeti szerző bizony beperelhet a bíróságon (aztán majd a bíró eldönti, hogy mennyire is "inspirálódás" vagy inkább lopás-e, amit tettél és hogy seggbe kell-e érte kúrni egy gumibottal vagy sem.)

Csak azért, mert az eredeti szerzőnek van jobb dolga is annál, mint hogy minden egyes engedély nélküli művészt feljelentsen a bíróságon, attól még nem lesz morálisan vagy legálisan helyes engedély nélkül más műveit felhasználni.

Itt több jogi probléma is adott.

1, Jogvédett anyag letöltése, feldolgozása, tárolása. A legtöbb országban a szerzői jog szabályozza hogy mit lehet és mit nem. Ez országonként különbözik. Itthon például lehet másolatokat készíteni magáncélra, pénzszerzési cél nélkül, viszont ezért cserébe fizetjük a reprográfiai dijat amiből a szerzőket kell(ene) kárpótolni. Ez itthon odáig megy hogy akár filmeket is le lehet tölteni amig magáncélra csinálod, Németországban ezért pár ezer eurós birságok repkednek. 

2, Ha a jog engedi is a másolat készítést, azt nem hozhatod nyilvánosságra, ahhoz engedély kell. Tehát hiába van fent mondjuk egy fotó egy honlapon azt te nem töltheted le és rakhatod ki a saját honlapodra, vagy blog postba, vagy akárhova. Erről bővebben itt lehet olvasni:

https://jogaszvilag.hu/szakma/hogyan-hasznalhatok-a-netrol-masolt-fotok/

3, USA-ban van egy olyan szabály hogy fair use. Ez elég bonyolult, de nagyjából azt a célt szolgálja hogy ha lehessen kutatni, hivatkozni, stb. dolgokat, tudjál kritikát írni, stb. Ez lehetőséget ad arra hogy ne kelljen engedélyt kérni egy adott mű használatához a szerzőtől. De, ahogy lent elolvashatod, ez üzleti célnál egyáltalán nem áll meg, illetve nem arra volt kitalálva hogy fogjuk az összes elérhető irott anyagot és ezt bedigitalizálva feldolgozzuk. 

https://copyrightalliance.org/faqs/what-is-fair-use/
https://copyright.psu.edu/copyright-basics/fair-use/

4, származtatás: ha fogsz egy művet és átdolgozod, akkor arra is külön szabályok vonatkoznak, a szerzői jog a tiéd lesz, viszont kell az eredeti szerzőtől engedély:

https://jogaszvilag.hu/szakma/atdolgozas-feldolgozas-forditas-ki-minosu…

Nézzük a problémákat az LLM-ekre vonatkozóan:

- Azokat az anyagokat amelyekből tanítanak jogszerűen szerezték-e be? A válasz az hogy valószínűleg nem, szerzői jogot sértve szereztek be és tároltak.
- Jogszerű volt-e az anyagok feldolgozása: itt is az a válasz az hogy valószínűleg nem.
- Történt-e jogvédett anyagok megosztása a részükről? Igen, bizonyos esetekben balfaszok voltak és simán visszatorrenteltek több GB-nyi könyvet. Helló Meta. Hogy ez miért problémás? Azért, mert az USA-ban ennél kevesebbért kapott valaki több évtizedes börtönbüntetést. 
- Képes-e az LLM hogy komplett részleteket visszaadjon? Igen, természetesen képes, bizonyos esetekben viszont figyelik a prompt-okat és tiltják a válaszadást, ezzel próbálva kicselezni a szabályozást.
- Ha az LLM visszaad egy eredményt, akkor annak ki a szerzője, ki a jogtulajdonos? A jelenlegi szabályozás alapján, mivel nem történt emberi közreműködés, ezért ezek a kimenetek nem állnak szerzői jog hatálya alatt. Ebből viszont következik egy dolog amiről nem akarnak beszélni: te, mint a fejlesztő, SEM leszel jogtulajdonosa a kódnak, tehát nem is mondhatsz le róla a céged részére. Tehát a kódbázis tele lesz olyan kódrészletekkel, amelyet a céged nem birtokol, tehát ha ez kikerül a netre és használtok a cégnél LLM-et, és valaki ezt úgy ahogy van ellopja és felhasználja, akkor neked kéne bizonyítani hogy az adott kódrészleteket ember írta és nem gép, tehát neked, mint cég, szerzői jogod van a kód felett. Ez egy baromira kellemetlen helyzet lehet, és nincs rá még se folyamat, se precedens.

> Képes-e az LLM hogy komplett részleteket visszaadjon? Igen, természetesen képes

csak annyira kepes mint egy ember. valoszinu par hires dalszoveget, ismert verset, himnuszt stb mindenki vissza tudna mondani fejbol, de barmit amit valaha eleteben tanult, olvasott nem sokan.  az llm-ekben nincs tarolva 1:1-ben a tanitasahoz hasznalt anyag, nincs adatbazisa ahogy sokan ezt elkepzelik. neuron suly ertekek vannak, ami alapjan szavak egymas utani valoszinuseget tudja becsulni, ez csak akkor fog pontosan idezni barmit is ha az rengetegszer, NAGYON sokszor elofordult a tanitasahoz hasznalt inputban, es igy "beegett" a haloba.

Raadasul az LLM-ek tanitasahoz hasznalt text input sok 100 TB mennyisegu (csak a CommonCrawl evekkel ezelott 500TB korul volt), mig a legnagyobb LLM modelek is max 2-3TB meretuek.

a kepgeneraloknal meg szembetunobb, az SD 1.x-et 600 millio fotoval tanitottak, a kesz model csak 2 GB volt. ennek ellenere egy Mona Lisat egesz jol meg tudott "festeni", sot sok vizjelet is megtanult es random kepekre rarakta oket, neha meg ala is irta a muveit valaki neveben... sot megtanulta a jpeg tomorites artifactokat is, sikerult direkt szar minosegu kepeket is generalnia. ezekbol csak az latszik, ha valami eleg sokszor szerepel az inputban, az beeg a modelbe.

 

Itt van Sándor Petőfi "Anyám tyúkja" című versének első 4 sora:

Hejj, mi a kó, tyúkanyó kend?
Miért olyan szomorú, miért olyan kend?
Meglőtték a tyúkod, vagy a kertedet?
Vagy talán a szomszédod a szemétet?

Speed: 1.2 t/s

 

 

Ez részben igaz, de:

https://arxiv.org/abs/2012.07805

https://not-just-memorization.github.io/extracting-training-data-from-c…

Itt ugye az is gond hogy a modellben (adatbázisban) benne vannak személyes adatok, név, telefonszám, stb. Ez kapásból GDPR sértés!

Illetve a lényeg nem csak az hogy van egy LLM modelled, hanem van egy komplett cég mögötte, amely rengeteg adatot letölt, tárol, és feldolgoz. Ez az a pont ahol a szerzői jog mindenképpen sérül, nem (csak) a modell esetében. 

> benne vannak személyes adatok, név, telefonszám, stb. Ez kapásból GDPR sértés!

de mar azota hogy kikerult a webre. az AI csak megtanulta onnan...  abban van igaza a tanulmanynak hogy az AI-bol nehezebb torolni, mint webrol (nem mintha onnan igazabol lehetne, ugye annyi keresmotor, archive.org, commoncrawl/webtext/stb van)

> rengeteg adatot letölt, tárol, és feldolgoz

mondjuk lattam mar olyan megoldast ahol valamelyik datasetet streamelve toltak be az ai-ba, nem taroltak lokalisan (azert egy 500TB-os commoncrawl-nal az sem trivialis mar hova mented le)