Már nyíltan akarnak lopni az LLM cégek

HUP cikkturkáló

Egy hetes hír, az LLM cégek konkrétan azt hazudták Trumpnak, hogy nemzetbiztonsági kérdés, hogy lophassanak.
Google, OpenAI want ‘license to steal’ from publishers with AI proposals

Természetesen hatalmas felháborodást keltett a dolog, és egy valag újabb pert kaptak válaszul a nyakukba. Kérdés, hogy a köztudottan idióta Trump és Musk mit lép erre. Trump képes bedőlni a hülyeségeknek, de Musknak benne van a bögyében az OpenAI, személyes utálat fűti velük kapcsolatban, és mint köztudott, elég nagy befolyása van Trumpra.

Közben a folyamatban lévő perek beérnek, az egyik legelső, amit még 2020-ban indítottak, a múlt hónapban lezárult az LLM cég teljes vereségével. Hogy ez miért lényeges? Mert amerikában precedensjog van, azaz a többi per a legelső per ítéletére fog hivatkozni, és hasonló eredménnyel fog zárulni.

2743 megtekintés

...a köztudottan idióta Trump és Musk mit lép erre. Trump képes bedőlni a hülyeségeknek...

Bejelzett a TROLLDETEKTOR!!!!

7 szavazat

A hozzászóláshoz be kell jelentkezni

Mármint a TE esetedben, úgy értetted? Igen, beriaszt rád.

ps: idézet a linkelt oldalról: "...amennyiben a válaszposztra..." és "a feltett kérdésre nem próbál meg válaszolni". Namost gondolkodj el azon, hogy a hozzászólásodnak mennyi köze van a témához, és hogy egyáltalán a TOPIKNYITÓ mennyire lehetne VÁLASZPOSZT, már úgy eleve...

Ezzel megint csak magadat égetted be, TROLL. Persze nem is vártunk tőled mást, LOL.

Trumpról meg hivatásos pszihológusok állítják, hogy egy idióta.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ne trollkodj itt, te troll!

Nem dőlünk be az ámításodnak!!

...pszihológusok állítják...

https://a.te.ervelesi.hibad.hu/tekintelyre-hivatkozas

2 szavazat

A hozzászóláshoz be kell jelentkezni

Nem menni az magrot ragzani, mert te lenni ostoba, ugyi?

ámításodnak!!

Ezt nekem írtad, egyes szám második személyben, csakhogy nem is én állítom, hogy Trump egy elmebeteg, hanem számos tanulmány és többszáz hivatásos pszihológus.
President Trump’s Personality
The Mind of Donald Trump - Narcissism, disagreeableness, grandiosity
More than 230 doctors say Trump is too unstable
233 Mental Health Professionals Spell Out Dangers Of Donald Trump
The Dangerous Case of Donald Trump: 27 Psychiatrists and Mental Health Experts Assess a President
...stb.

Megint belesétáltál a csapdába, TROLL. És nem, hivatásos szakvéleményre hivatkozni NEM tekintélyre hivatkozás, még véletlenül sem! Persze egy hozzád hasonlótól nem várom el, hogy megértse.

A továbbiakban nem válaszolok a posztjaidra, főlj csak a saját levedben! Magadnak ástad a sírt.

0 szavazat

A hozzászóláshoz be kell jelentkezni

USAID által fizetett pszichológusok? 😂😂😂😂

3 szavazat

A hozzászóláshoz be kell jelentkezni

Csak irigykedik bzt, mert ő csak egy bot, aki nem tud GIT-re regisztrálni! :-D

Bezzeg az AI nagytestvérek azok simán átmennek a bot-szűrőn és viszik az anyagot és jól megtanulják.

Ha egy embernek joga van bármilyen copyright anyagot elolvasni ha egyszer már megvette és tanulni a tartalmából, akkor egy Ai-nak miért lenne tilos?! Le az AIszemita gyűlölködőkkel, akik meg akarják fosztani mesterséges barátainkat a tanulás jogától! :-)

“Az ellenség keze betette a lábát”

3 szavazat

A hozzászóláshoz be kell jelentkezni

Ha akarod, bármikor szerzek neked ugyanilyet, amit aláír több ezer pszichológus, csak arról fog szólni, hogy idióta vagy. Tudod, az internet mindent elbír.

Az elnök vagy elmebeteg, vagy annak van beállítva. Egyelőre Elon Musk is elmebeteg, megvette a twittert más pénzén, teljesen szétzilálta, kirúgta az alkalmazottak 2/3-át, és láttuk, hogy össze fog omlani.

Erre aztán csak áll, és működik, jobb AI van alatta, mint a Googlenek ami van (legalábbis nem rajzol néger hitlert), továbbra is a legfőbb hírközlő alkalmazás az USÁban.

De jah, biztosan igazad van, és felnőtt férfiként még hinned kell a mesében. Gratulálok!

9 szavazat

A hozzászóláshoz be kell jelentkezni

Joe Biden sem volt alkalmatlan az elnöki hivatal betöltésére =). Mint az közismert.

https://www.youtube.com/watch?v=PONgA1i9uoU

2 szavazat

A hozzászóláshoz be kell jelentkezni

- Es Safranek - udvozlom a kedves feleseget!

- Koszonom uram, de mar egy eve onnel el.

2 szavazat

A hozzászóláshoz be kell jelentkezni

De jah, biztosan igazad van, és felnőtt férfiként még hinned kell a mesében

Mondja a TROLL, aki még arra sem veszi a fáradságot, hogy megnézze, Trump első két hónapnyi uralkodása alatt mennyit is esett valójában az amerikai GDP. De persze, én hiszek a mesékben, LOL.
https://fortune.com/2025/03/01/us-economy-recession-outlook-q1-gdp-cont…
Erre mondják, hogy a számok nem hazudnak.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Egy szakértői véleményre hivatkozás nem a tekintélyre hivatkozás. Egy pszichológusi vélemény elsősorban szakvélemény, amit még a bíróság is valid bizonyítékként fogad el.

Avagy az is egy érvelési hiba, ha érvelési hibákat keresel a másik mondanivalójában, ahelyett, hogy a modnanivalójára reagálnál.

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával

via @snq-

0 szavazat

A hozzászóláshoz be kell jelentkezni

Visszatérve a TROLLgyalázás után a témára, szerintetek mennyi esélye van, hogy Trump mentesíti az LLM cégeket a copyright jogi védelem alól? És ha igen, akkor vajon ez milyen kihatással lesz az általuk kínált szolgáltatás copyright jogaira?

0 szavazat

A hozzászóláshoz be kell jelentkezni

A copyright rendszer úgy van elbaszva Miki egerestől kezdve mindenestül, hogy az csak na!

On the one hand, Disney pushed for the law that extended the copyright term to 95 years, which became referred to derisively as the “Mickey Mouse Protection Act.”

Itt az ideje, hogy végre megreformálják az egész baromságot, hogy ne csak egy szűk, elit kör gazdagodjon abból, amit 100 éve valaki random kitalált, hanem végre az egész emberiség profitáljon a nyílt tudásmegosztásból.

5 szavazat

A hozzászóláshoz be kell jelentkezni

Már látom magamelőtt a piratebay2 -t hogy "a linkelt anyagok kizárólag LLM tanításra használhatóak"

3 szavazat

A hozzászóláshoz be kell jelentkezni

Akartam is írni hogy ha ezt lehet, akkor innentől kezdve az összes film, zene, könyv, audióanyagot nyugodtan lehet tölteni a netről, ugyanis ki mondja meg, hogy én abból nem LLM-et akarok-e tanítani. Ja, hát nekem ez pár évig tart, kérem, kis pénz, kis foci.

3 szavazat

A hozzászóláshoz be kell jelentkezni

Meg ugye előtte végig is kell nézni az összeset, nehogy szar anyagból tanuljon az LLM :)))

4 szavazat

A hozzászóláshoz be kell jelentkezni

Ugyanezt az érvet a szabadalmakkal szemben is fel lehet hozni. De kötve hiszem, hogy az LLM cégek a szabadalmak eltörlését kívánnák. (Tehát vannak érvek a szellemi tulajdon koncepciója ellen, en bloc. De ebben az esetben nem jóhiszeműségről van szó, amit a nemzetbiztonsági bullshit előrángatása szerintem egyértelműen bizonyít.)

1 szavazat

A hozzászóláshoz be kell jelentkezni

Trump annyira idióta, hogy USA már össze is omlott. Írták az elmebetegcsoportban a facebookon. Láttad?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Őszinte leszek, én valahol a kettő közötti megoldásban hiszek. Jó lenne magát a szerzői jogi rendszert megreformálni, mert egyre több olyan embert is bántanak, akik minden rossz szándék nélkül használnának egy jogvédett tartalmat, és őket viszont nem védi semmi a kőgazdag cégek terjedelmes jogi osztályaitól. Cserébe a licencdíjak vagy nem publikusak, vagy az egekbe szöknek. Az egész rendszer úgy van felépítve, hogy bonyolult, nem transzparens, és kifejezetten pénzorientált legyen. Tisztelet a kivételnek.

Ugyanakkor - és ez fontos! - nem gondolom, hogy az LLM védendő dolognak minősülne. Felháborított amikor kiderült, hogy nem csak hogy nem licencelték a tanítási anyagokat, de még csak nem is szóltak az érintett szerzőknek, hogy helló, akkor felhasználnánk erre és erre. Ez egyszerűen morálisan elfogadhatatlan, és ennek tükröződni kellene a szabályozásban. És ennek nem kell múlhatatlanul közének lenni a jogdíjakhoz, de igenis legalább a CC-BY jellegű védelem illesse meg a tanítási anyagokat is. Mondjuk, legyenek kötelesek letölthetővé tenni a tanításra használt szerzők-anyagok teljes listáját. És igen, értem, hogy ez fáj. Fájjon.

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával

via @snq-

1 szavazat

A hozzászóláshoz be kell jelentkezni

Mégegyszer, mert egyesek jól láthatóan nem értik, miról van szó. A gyengébbek kedvéért leegyszerűsítem.

Ha elfogadjuk, amit az LLM cégek állítanak (nevezetesen: nem illeti meg a copyright védelem azt, ami a neten van és mindent fair use használni), akkor mi a helyzet magukkal az LLM cégek szolgáltatásaival? Merthogy ugyanezen érvelés mentén akkor a ChatGPT kimenetét sem illeti meg a copyright védelem, ugyebár.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Válaszolhatsz nekem is nyugodtan, nem kell ez a passzív-agresszív, "nem beszélek közvetlen hozzád, de azt azért elég hangosan teszem, hogy te is halljad" feminin attitűd.

Igen, remélhetőleg az LLM-ek kimenete is mentesítve lesz a copyright védelme alól.

Ez az egyik legnagyobb akadálya az LLM használatának céges környezetben. A generált kódot nem használhatod fel a kódbázisban, mert a cégnek fogalma sincs, hogy ki a copyright holder ebben az esetben.

A másik meg a saját IP védelme, de arra talán már van, vagy hamarosan lesz válasza az AI cégeknek (dedikált/lokális szerverfarmon futó LLM-ek, amik garantáltan nem gyűjtik az inputot további training céljából).

Ld. Apple Private Cloud Compute, ami jó irányba indult el:

User data stays on the PCC nodes that are processing the request only until the response is returned. PCC deletes the user’s data after fulfilling the request, and no user data is retained in any form after the response is returned.
User data is never available to Apple — even to staff with administrative access to the production service or hardware.

https://security.apple.com/blog/private-cloud-compute/

0 szavazat

A hozzászóláshoz be kell jelentkezni

Az ugye megvan, hogy nem mindegy hogy van-e copyright vagy a felhasználóé-e a copyright, mert ez két külön eset.

Ahogy most a helyzet kinéz ez teljesen ország függő, de általában az a helyzet hogy a generált LLM kód felett nincs szerzői jogod. Ez pedig azt jelenti céges szinten hogy ha te a kódodbázisba ilyen kódot használsz, valaki betör, ellopja, majd pedig kirakja az internetre, amit aztán valaki más felhasznál, akkor semmilyen jogalapod nem lesz kártérítésre, hiszen nem volt a fejlesztődé a szerzői jog, tehát le sem mondhatott róla a céged javára.

Ha viszont az LLM-t felhasználóé a szerzői jog, akkor ez jó, mivel igy a szerzői jog átkerül a céghez, és van védelem.

De ez mind hiába, mert ha az LLM egy olyan forrásból lett tanítva amelynek a copyright-ja nem megengedő, és neked ezt egy az egyben visszaadja, amit te felhasználsz, akkor ugyanúgy jogsértést fogsz elkövetni, kivétel, ha nem tudod minden sor kódra bizonyítani, hogy annak mi a forrása (LLM, fejlesztő saját kis buksija, harmadik féltől átvéve)

0 szavazat

A hozzászóláshoz be kell jelentkezni

A napokban volt róla hír, hogy

A federal appeals court in Washington, D.C., on Tuesday affirmed that a work of art generated by artificial intelligence without human input cannot be copyrighted under U.S. law.

link

Mondjuk ezt én nem értem. Mi az hogy "generated without human input"? Csak random elkezdett az AI rendszer képeket generálni? Senki nem indította el a programot, senki nem promptolt?

Vagy itt arra gondolnak, hogy a szerzőnek kell megrajzolnia, megfestenie?

Miben különbözik ez egy fotóstól, aki megkomponálja a képet, de a fotót már maga a Digitális Gép kreálja, gyakran ML/AI segítségével. Akkor egy DSLR-ral, telefonnal készített kép sem esik szerzői jog alá? Miben különbözik ez a kompozíció a promptolástól?

Ha írok egy C programot, akkor annak a forráskódjának a szerzői joga engem illet, de ha kiadom a 'gcc' parancsot, akkor a generált assembly kód már nem esik az én szerzői jogom alá?

1 szavazat

A hozzászóláshoz be kell jelentkezni

A system prompt technikailag ugyan inputnak minősül, de körbepapírozhatónak tűnik, hogy azt a rendszer részének kell tekinteni (hence the "system prompt" terminology), emiatt ha van egy "generálj random képet" gomb, ami bizonyíthatóan nem ad addicionális promptot a gépnek, hanem ő magának generál egy promptot, akkor az valószínűleg nem lesz copyrighted.

Emiatt kicsit más, mint a gcc-s példa, mert a gcc nem képes önerőből futtatható kódot generálni, ahhoz kell valamilyen input (forráskód). Igen, ez már nem technológia, ez már főleg jogászkodás.

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával

via @snq-

0 szavazat

A hozzászóláshoz be kell jelentkezni

Egyszerű: Ők nyerészkedhessenek, mert multik és nem terézanyák™ és profitot kell maximalizálniuk, ami sokkal hatékonyabb, ha etikátlanul teszik.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Merthogy ugyanezen érvelés mentén akkor a ChatGPT kimenetét sem illeti meg a copyright védelem, ugyebár.

Merthogy most megilleti? Nem költői kérdés.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hát legalábbis sír a gazdája szája, hogy a deepseek-et abból tanították...

0 szavazat

A hozzászóláshoz be kell jelentkezni

Szerintem ugyanez lefutott már egyszer, amikor a keresőmotorok elkezdték felindexelni a világot. Most ugyanaz megy pepitában.

6 szavazat

A hozzászóláshoz be kell jelentkezni

Nem egészen, ugyanis a keresőmotorok
- egyrészt nem készítenek származékos művet az oldalakból, csak indexelnek,
- másrészt ingyenesen hozzáférhetővé tették a keresési eredményeket (legalábbis a legnagyobbak, mint a Google pl. így jogi értelemben nem értékesítették a begyűjtött adatokat, csak a reklámfelületet, ami egész más)

Ezzel szemben az LLM
- a lopott adatokon betanított szolgáltatásaikért copyright jogot követelnek (annak ellenére, hogy ezt a 17 U.S.C. § 101 törvény, de még a saját Terms of Use szabályzatuk is tiltja) és
- pénzt kérnek a használatért (ráadásul pofátlanul sokat), tehát egyértelműen továbbértékesítik a begyűjtött adatokat
- a felhasználás módja pedig nem is csupán indexelés, hanem származékos műnek minősül, így jogilag más kategória (*).

(*) - ez egy darabig vita tárgya volt, a mostani bírósági ítélet döntötte el a kérdést végleg, hogy igen, egy MI által generált tartalom bizony a betanított adatokból képzett származékos mű jogi értelemben.

2 szavazat

A hozzászóláshoz be kell jelentkezni

Azért manipulálják a keresési találatokat, nem kicsit tolva a szélsőbalos idióták szekerét.

3 szavazat

A hozzászóláshoz be kell jelentkezni

És ez a hozzászólásod azért kapcsolódik az LLM témához, mert... Ja, nem is kapcsolódik semennyire, csak TROLLkodni próbáltál, de csúnyán felsültél vele.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Borzasztó kínos ez a trollos vergődésed.

t. egy troll

5 szavazat

A hozzászóláshoz be kell jelentkezni

Meta: általában igen, de Sanya olvtárs tényleg csak trollkodni jár ide.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Viszont:

ugyanúgy ingyen jutnak az adatokhoz, hírekhez
ugyanúgy pénzt csinálnak belőle
- ugyanúgy lenyúlják a kattintásokat
ugyanúgy hajlandók a történelemhamisítára
ugyanúgy hajlandók nagyjából bármilyen hülyeséget állítani (=megtalálni)
- jó pénzért ezt még előtérbe is helyezik, lásd történelemhamisítás
ugyanúgy manipulálják a keresési találatokat, nem kicsit tolva a szélsőjobbos idióták szekerét (már csak az egyensúly kedvéért)
gyakorlatilag az van, amiért elég sokat fizet bárki is (szerencsés esetben mindkét-három-bármennyi oldal egyformán fizet, szóval a platform tulajdonosa lesz kőgazdag, és az az igazság, amit Ő állít - kitalált történet :D)

A történelemhamisítás részhez: emlékszem olyan hírekre, hogy a DeepWater Horizon megdőlése után, és végül meg is találtam, most még kidobja az AI, egy kis noszogatás után, szóval olyan hírekre, hogy BP rettenetes mennyiségű pénzt költött reklámokra, hogy a reputációját helyrehozza. Őszintén szólva fogalmam nincs milyen sikerrel, de ott a tanulmány.

(Az már csak hab a tortán, hogy rémlik olyan híráramlat is, hogy két-három évvel később olyan hírek jöttek, hogy nem is volt ez olyan problémás, virágzik az élővilág, fasza minden, és ugye általában az utolsó hírek maradnak meg a fejekben. De ilyesmit most végképp nincs energiám előkeresni.)

Szóval én nagyon-nagyon sok párhuzamot látok. Régen azok haltak meg, akik lovaskocsihoz voltak szokva, és kibotorkáltak az autó elé, most azok fognak, akik elhiszik, amit "az interneten látnak".

És jobban át kellett volna gondolni, de a reggeli kávéba ennyi fért bele.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Keress rá a Nord Stream 2 felrobbantásának környezeti hatásaira :).

0 szavazat

A hozzászóláshoz be kell jelentkezni

- egyrészt nem készítenek származékos művet az oldalakból, csak indexelnek,

Az nem származékos mű, hogy rákeresel valamire, és kiteszi egyből a választ a lap tetejére anélkül, hogy neked a valós forrást meg kellene nyitnod (és ezzel mondjuk az ottani reklámokat megnézve bevételt generálnál az alkotónak)?

- másrészt ingyenesen hozzáférhetővé tették a keresési eredményeket

A legtöbb LLM-nek is van free tierje, számít ez a megkülönböztetés?

1 szavazat

A hozzászóláshoz be kell jelentkezni

Nem is értem, ha a locsogóprogram mások munkáiból összeollóz nekem valamit, akkor esetleg nem én leszek jogilag annak a szerzője?! Ez milyen etikátlan már!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Nemide.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Pont ugyanannyira mint bármely szerző aki nem egy offline lakatlan szigeten nőtt fel, bármely művében mások művéből szerzett tudását kamatoztatja. Az miért az övé? Ez már rég nem jogi, hanem filozófiai és gazdasági kérdés.

3 szavazat

A hozzászóláshoz be kell jelentkezni

ha a locsogóprogram mások munkáiból összeollóz nekem valamit, akkor esetleg nem én leszek jogilag annak a szerzője?!

De, te leszel a szerzője, ezzel nincs is gond, csak a felhasznált anyagokkal, illetve a locsogóprogram kimenetére támasztott jogi igényekkel van gond.

Megpróbálom röviden összefoglalni, mi a gond ezzel:
- Egyrészről, ha csakis saját kútfőből csinálsz valamit, akkor te vagy a szerző és a kizárólagos szellemijog tulajdonosa, így te szabod meg a felételeket. Ez sima csiga.
- Ha viszont másvalaki munkájára támaszkodva csinálsz valamit, akkor hiába vagy te a szerző, nem csak te szabod a feltételeket, hanem be kell tartanod a felhasznált munkák feltételeit is. Ha például az eredeti szerző nem járult hozzá, hogy a művére építs, és nem is nevezed meg, hogy eredetileg az ő műve, az simán plágium. Ha engedi, de feltételekkel, de te szarsz ezekre a feltételekre, akkor az meg licenszsértés. Mindkettő bűntetendő, utóbbi a Berne Convention értelmében nemzetközileg is (ezt 1988-ban írta alá az USA, így tehát az OpenAi-ra, mint amcsi cégre is vonatkozik).
- Másrészről, amcsiknál törvény mondja ki, hogy a program licensze nem vonatkozhat a program kimenetére, az a felhasználót illeti (például ha te írsz egy regényt Winwordben, akkor hiába a Microsoft-é a Winword copyright joga, attól még a benne írt regény joga mégsem lehet az övék). Az OpenAI most mégis azzal próbál érvelni, hogy a ChatGPT kimenete az ö jogtulajdonuk (pedig hát nyilván nem, ezt még a saját felhasználási feltételeik is kimondják, ráadásul a bemenet sem volt már eleve az övék).

1 szavazat

A hozzászóláshoz be kell jelentkezni

Hát figy... nem állítom hogy borzalmasan sok szakdolgozatot néztem át, de amikor kibassza a szemem, hogy az egyik harmadát innét, a másik harmadát onnét, a maradékot meg amonnét másolta a "szerző", mert még a betűtípus is más, akkor... akkor nem is értem mi a probléma.

(Lediplomázott.)

---

Hirtelen felindulásból, koffeinsokk hatása alatt született hozzászólás.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Bocs, de először locsolóprogramnak olvastam.

Még nincs aláírásom.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha jol ertem, akor arrol vitaznak, hogy az interneten a "lehet-e lopni" es a "szabad-e lopni" lerdesek koze ES vagy pedig VAGY muvelet keruljom.

Mivel teny, hogy a vilag nagy resze a masodik feltetel letezeset csak akkor veszi eszre, amikor a sajat szellemi tulajdona kerul szoba, ezert ezt a dolgot en ugy veszem, mintha torvennyel akarnak megtiltani a politikusoknak, hogy hazudjanak. Elvegre az internet konkretan arra valo, hogy korbelopkodjuk egymast. :-)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha jol ertem

Nem jól érted.

akor arrol vitaznak, hogy az interneten a "lehet-e lopni" es a "szabad-e lopni" lerdesek koze ES vagy pedig VAGY muvelet keruljom.

Nem. Nagyon nagyon leegyszerűsítve, azt próbálják állítani, hogy ha ők lopnak az fair use, de ha tőlük lopnak az meg nem fair use.

amikor a sajat szellemi tulajdona kerul szoba

És ismét csak nem érted, az OpenAI-nak nincs is saját szellemi tulajdona, a betanításhoz felhasznált adatokat másoktól lopták. Soha nem is volt az övék, és engedélyt sem kaptak a felhasználásra.

2 szavazat

A hozzászóláshoz be kell jelentkezni

Na es az a 4 dvd nem nagy kaland.

Every single person is a fool, insane, a failure, or a bad person to at least ten people.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Egy másik nézőpont: tegyük fel, hogy te elolvasol több ezer könyvet (olcsón, mert pl. könyvtárba jársz, vagy iskolában ingyen kölcsönadják a tankönyvet), ezek tartalmát nagyjából megjegyzed és okos leszel tőle, és ezután ebből a tudásból meg akarsz nézni, és pénzt akarsz keresni. Na, az AI tanítás is kb. ez.

De hasonlíthatjuk egy netes keresőhöz is. A kereső és az AI is elolvasott nagyon sok weboldalt. A kereső és az AI is képes kivonatolt tartalmat közzétenni ezekből (de nem szóról szóra mondják vissza), összefoglalókat írni, a tartalomból következtetéseket levonni (egy kérésre adott találati oldal összerakásához nem kevés elemzés kell). A kereső és az AI sincs általában ingyen (a keresőkért tipikusan reklámfogyasztással fizetsz, de van teljesen ingyenes is, AI-ból is van teljesen ingyenesen elérhető alapverzió).

Vagy akár egy újságíróhoz is hasonlíthatjuk. Egy újságíró elolvas egy könyvet, megnéz egy filmet, elolvassa másik újságírók munkáját, és ezután ír egy saját cikket, amiből pénzt kap, de abból a pénzből az eredeti művek szerzői nagyon keveset (pl. egy mozijegy ára) vagy semmit nem kapnak.

Egyébként meg mi itt hiába beszélünk róla laikusként, ezt a különböző stakeholderek és ügyvédeik közötti hosszú jogi csatározás fogja eldönteni. Az én tippem, hogy a fenti példákhoz hasonlóan az AI cégek majd egy jelképes összeget fizetnek bizonyos művek használatáért, de utána azt kezdenek az anyaggal, amit akarnak.

2 szavazat

A hozzászóláshoz be kell jelentkezni

Artisjus sarc per token

1 szavazat

A hozzászóláshoz be kell jelentkezni

Bár elég szűklátókörű és diktatórikus vagy ahogy olvasom, de nem csak a hülyeségeket kellene olvasnod a neten, hanem gondolkodni is kellene mert így nem vagy jobb mint egy egyszerű LLM.

Az AI is egy új fegyverkezési verseny. Ha nem történik valamiféle globális jogharmonizáció vagy szabályozás, akkor a Amerika lemarad Kínával szemben. Kínában ott van tükrözve az egész internet naprakészen. Van miből tanítani az LLM-eket, így a végén a minőség és kapacitáskülönbség a kínai modellek javára dőlhet el.

Kell AI/LLM Fair Use Act, mert ahol az elavult szerzői jog miatt ez nem következik be, az lemarad a globális AI fegyverkezésben.

Az EU-t fel se hozom, mert mire Brüsszelben bármit is döntenek, addigra el megy mellettük a világ, és kezdhetik elölről.

6 szavazat

A hozzászóláshoz be kell jelentkezni

Bár elég szűklátókörű és diktatórikus vagy ahogy olvasom

Látom nem megy a szövegértés, és nem is érted a lényeget.

Kínában ott van tükrözve az egész internet naprakészen. Van miből tanítani az LLM-eket

Nem tudom, ezt honnan vetted, mert nincs. Ennek ékes bizonyítéka, hogy a DeepSeek-et nem is az interneten tanították be, hanem konkrétan a ChatGPT kimenetén.

Kell AI/LLM Fair Use Act, mert ahol az elavult szerzői jog miatt ez nem következik be, az lemarad a globális AI fegyverkezésben.

Tehát szerinted hülyeségeket beszél az OpenAI, amikor a kimenetét próbálja elavult szerzői jogra hivatkozva védeni, hiszen az fair use volt, hogy a DeekSeek desztillálta. Ezt akarod mondani?

Megjegyzem: az OpenAI-nak semmi joga felháborodni azon, hogy desztillálták, mivel a saját szabályzatában is szerepel, hogy a kimenetre nem formálhatnak copyright jogot, és a DeepSeek fizetett az API használatért, így legálisan jutott hozzá a kimenethez.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Látom nem megy a szövegértés, és nem is érted a lényeget.

A sok hülye jön veled szembe a pályán!

1 szavazat

A hozzászóláshoz be kell jelentkezni

És ezt abból szűrted le, hogy FeriX tényszerűen valótlan állításokat tett?
Gratula.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Látom nem megy a szövegértés, és nem is érted a lényeget.

Nagyon is értem a lényeget. Olyan fajta ember vagy aki elolvas valamit és elhiszi. Olyan dolgokat állítasz és olyan linkeket helyezel el, amitől a tükör előtt állva látod magadon a glóriát miközben büszkén veregeted a vállad. De persze ez is egy álláspont.

Nem tudom, ezt honnan vetted, mert nincs. Ennek ékes bizonyítéka, hogy a DeepSeek-et nem is az interneten tanították be, hanem konkrétan a ChatGPT kimenetén.

A szűklátókörűségnek ez a lényege. Abban a hitben vagy hogy Kínában csak a DeepSeek létezik, mint érvelő modell. És igen, ékes bizonyítéka annak, többféle DeepSeek létezik attól függően, melyik országban használják, információk szándékos eltitkolásával, politikai torzítóként. Boldogok a lelkiszegények.

Tehát szerinted hülyeségeket beszél az OpenAI, amikor a kimenetét próbálja elavult szerzői jogra hivatkozva védeni, hiszen az fair use volt, hogy a DeekSeek desztillálta. Ezt akarod mondani?

Az OpenAI hülyeségeket beszél, amikor a kimenetét próbálja elavult szerzői jogra hivatkozva védeni.

Megjegyzem: az OpenAI-nak semmi joga felháborodni azon, hogy desztillálták, mivel a saját szabályzatában is szerepel, hogy a kimenetre nem formálhatnak copyright jogot, és a DeepSeek fizetett az API használatért, így legálisan jutott hozzá a kimenethez.

Ezt még a hülye is tudja.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Látom, habzó szájjal tobzódnak a TROLLok, akik nem is értik, mi volt a kérdés, és nem is képesek érdemben hozzászólni.

Sajnálatos, hogy ide süllyedt a HUP, mondjuk abban az országban, ahol a miniszterelnök nyíltan Hitlertől és Szálasitól idéz, ez csöppet sem meglepő. (És ha már itt tartunk, aki tanult valaha is iskolában történelmet, az tudja, hogy a "tegyük naggyá megint" szlogen eredetileg Mussolini hívószava volt.) De persze nyilván nem a TROLLok dőltek be a progandaista mesének, hanem mindeni más téved (szarkazmus)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ne TROLLkodjál itt, te TROLL!

Ha nem offoltad volna szét a topicot a TROLLkodásoddal, akkor nem lenne itt semmi probéma.

De te nem tudsz magadon segíteni, csak egy egyszerű TROLL vagy!

1 szavazat

A hozzászóláshoz be kell jelentkezni

Na, kire riaszt most be a kis TROLLdetektor?

Nem állt szándékomban válaszolni, de meg kell köszönöm ez a kimagasló intellegienciát demonstráló, építő jellegű, témáról szóló, igen intellektuális, sértegetésektől mentes hozzászólást! (szarkazmus)
ps. az ugye megvan, hogy most csak magadat járattad le, és pont hogy nekem adtál igazat a posztoddal? Á, kizárt, hogy felfognád, mit is tettél. Hisz még a topiknyitót sem tudod megkülönböztetni egy válaszposzttól.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Már a nyitóposztban is TROLLkodtál, te TROLL!

0 szavazat

A hozzászóláshoz be kell jelentkezni

Csak a vicc kedvéért heccellek még egy kicsit! :-D

Már a nyitóposztban is TROLLkodtál

Bizonyítsd ezt, ha tudod! Azt ugye tudod, mit jelent az a szó, hogy "bizonyítás"?

Bizonyára elkerülte a figyelmed, hogy Én - veled ellentétben - már alátámasztottam a topiknyitóban tett állításom tényekkel (például, hogy Trump alatt az amerikai GDP +2.3%-ról MÍNUSZ 1.5%-ra zuhant), ellenben te TROLLhoz méltóan semmit sem támasztottál alá, sőt még csak meg sem próbáltad. Érvelés és forrásmegjelölés helyett te csak az elismert pszihológusokat próbáltad - persze eredménytelenül és tök feleslegesen - pocskondiázni, semmi mást nem tettél. Na ezért van az, hogy te az internet legundorítóbb pöcegödrében dagonyázó TROLL vagy, és még véletlenül sem azért, mert valaki (én vagy bárki más) ezt mondja. Quod Errat Demonstrandum.

És csak hogy tisztázzuk, nem várom el egy hozzád hasonló, buta agymosott TROLLtól, hogy felfogja, mit is írtam az imént. Az lenne inkább a meglepő, ha belátnád végre, hogy ha azt nézed csak, milyen ember mondta, na az az igazi https://a.te.ervelesi.hibad.hu/tekintelyre-hivatkozas

0 szavazat

A hozzászóláshoz be kell jelentkezni

Csak a vicc kedvéért heccellek még egy kicsit! :-D

Eltévesztetted a szerepedet.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Látod? Bármiféle érdemi reakció helyett ennyit voltál csak képes ideböfögni, mivel nem is értetted, amit írtam. Megmondtam én előre, hogy nem is vagy képes felfogni.
(csak helyfoglaló, nehogy kitörölhesd a bizonyítékot a saját butaságodra és alkalmatlanságodra ;-D)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Úgy van, bizony! TROLLkodjál még, te TROLL, annál többet úgyse tudsz 😂

0 szavazat

A hozzászóláshoz be kell jelentkezni

És ebben a hozzászólásodban az állításodra (vagy bármelyik korábbi állításodra) bármiféle bizonyíték, érv, alátámasztás vagy akárcsak forrásmegjelölés hol is van pontosan?

Mindig ez a műsorotok: idepofátlankodtok AZ ÉN TOPIKOMBA, a témához hozzá sem bírtok szólni, mert ahhoz túl hülyék vagytok, helyette csak személyeskedni meg sértegetni próbáltok, de persze az sem jön össze soha, helyette csúnyán beégetlek mindig titeket.

Tudod, veled ellentétben én sosem tagadtam, hogy aki TROLLkodni próbál, azt csúnyán viszont fogom TROLLkodni! Bár igazából most nem is én voltam, mert amilyen hülye vagy, saját magadat járattad le, LOL.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Jólvan, meguntam a TROLLkodásodat, te TROLL.

Majd jelentkezz, ha van valami értelmes mondanivalód.

0 szavazat

A hozzászóláshoz be kell jelentkezni

És ők is bedobják az AI szabadalmaikat a közösbe, vagy az a szellemi tulajdon szent és sérthetetlen?

Teljesen jogos érv, hogy az IP védelem jelenlegi keretei már fékezik az innovációt. De ha a nemzetbiztonság bullshittel akarják a saját pozíciójukat bebástyázni miközben ők semmilyen áldozatot nem hoznak, akkor nehéz jóhiszeműséget, vagy akár jogos érdeket látni a dologban.

Amúgy Steve Banonnal néztem nemrég egy interjút. Mindenki azt gondol a figuráról amit akar, az államkapitalizmusa nekem se szimpatikus. De abban igaza van hogy a nagy tech privilegizáltak voltak, például a monopolellenes törvényeket nem alkalmazták velük szemben. Az egyezség szerinte kb. arról szólt hogy az amerikai kormány hagyja, hogy ezek a cégek kontrollálatlanul nőjenek és a tulajdonosaik a világ valaha volt leggazdagabb emberei legyenek, cserébe ők biztosítják a technológiai fölényt Kinával szemben. De, mint kiderült, az alku rájuk eső részét nem tudták teljesíteni.

1 szavazat

A hozzászóláshoz be kell jelentkezni

És ők is bedobják az AI szabadalmaikat a közösbe, vagy az a szellemi tulajdon szent és sérthetetlen?

Úgy van, ez itt a kérdés!

Teljesen jogos érv, hogy az IP védelem jelenlegi keretei már fékezik az innovációt. De ha a nemzetbiztonság bullshittel akarják a saját pozíciójukat bebástyázni miközben ők semmilyen áldozatot nem hoznak, akkor nehéz jóhiszeműséget, vagy akár jogos érdeket látni a dologban.

Pontosan erről van szó! Ha ők lopnak mástól, az okés, de ha más lop őtőlük, az nem okés? Tényleg nehéz ebben bármiféle jogosságot és jogegyenlőséget látni.

Nekem sokkal inkább ezt a kifacsart kommunista logikát juttatja eszembe: "ami a tiéd, az az enyém is, de ami az enyém, ahhoz semmi közöd!!!" Azt meg tudjuk történelemből, hogy ez a hozzállás zsákutca, csőd, egyenes út a bukáshoz.

De, mint kiderült, az alku rájuk eső részét nem tudták teljesíteni.

Megintcsak +sok! Ráadásul még pikánsabb annyival, hogy a Trumpra nagy befolyással bíró Musk személyesen rühelli az OpenAI-t, nem kis csavartlabdát dobva így az egésznek. Az külön érdekes lesz, ha csak a Musk-féle xAI kapja meg ezt a felhatalmazást, a jelenlegi amerikai piacvezetők meg nem.

0 szavazat

A hozzászóláshoz be kell jelentkezni

> az AI szabadalmaikat

milyen szabadalmakrol beszelsz?

0 szavazat

A hozzászóláshoz be kell jelentkezni

Amiket ezerszámra birtokolnak? De nem is csak az AI szabadalmakról van szó, inkább arról, miért pécéznék ki specifikusan a szerzői jogokat mint nemzetbiztonsági kockázatot? Miért nem a teljes IP védelmet akarják megreformálni? Mit adnak ők cserébe? Mert a történelmi precedens, hogy a „nemzetbiztonság” bullshit a hatalmi/pénzügyi érdekek szolgálatában.

0 szavazat

A hozzászóláshoz be kell jelentkezni

És mit adtak nekünk a rómaiak? :)

0 szavazat

A hozzászóláshoz be kell jelentkezni

Termékeket adtak nekünk, pénzért, amivel nagyon sokat kerestek. Ezt nem ítélem el, sőt, támogatom a kapitalizmust. De hogy sebészi pontossággal ott akarják meghúzni az IP védelem határát ahol ők a legtöbbet vehetnek ki belőle, az nem kapitalizmus.

4 szavazat

A hozzászóláshoz be kell jelentkezni

hagyjuk mar ezt az AI lopas temat, mert baromsag. ha az ember az iskolaban elolvas egy csomo konyvet, a muzeumokban megnez egy csomo kepet, esetleg meg a filmeket se veti meg, aztan ezekbol inspiralodva alkot valamit, akkor az is lopas? mert akkor MINDENKI is lop.

0 szavazat

A hozzászóláshoz be kell jelentkezni

aztan ezekbol inspiralodva alkot valamit, akkor az is lopas?

Rosszul tetted fel a kérdést. Ha valaki a ChatGPT kimenetén inspirálódva alkot valamit, akkor már az is lopás?
Nem lenne semmi gond ezzel az egésszel, ha az LLM cégek a nagy szabadság követelése mellett nem akarnák közben a saját kimenetüket jogilag védeni. Ha azt mondanák, hogy mindent szabad, beleértve azt is, hogy az ő kimenetüket is szabad másoknak felhasználni, akkor minden okés lenne.

De nem egészen ezt mondják, ugye?

mert akkor MINDENKI is lop.

Nem. Ha a felhasznált művek licenszfeltételeit betartod, és engedélyt kapsz a jogtulajdonostól, akkor az NEM lopás. Civilizált világban ez így szokás.

0 szavazat

A hozzászóláshoz be kell jelentkezni

egyreszt abban egyetertek, hogy nem kene jogilag vedeni az outputot, ahogy pl a deepseek es sok mas model nem is teszi.

masreszt ha egy ember inspiralodva masik muveibol alkot valamit, azt alanyi jogon vedi a szerzoi jog, nemde?

persze sokan (te is) lenezik az ai-t, hogy "az csak egy algoritmus", de a mai modelek (a transformer alapuak) mar nagyon hasonloan mukodnek mint az emberek. en mostanaban rengeteget hasznaltam a deepseeket (a teljes modelt, lokalisan futtatva, nem a distilled szarokat) tech doksik iratasara, es brutalis. megirom par sorban a vazlatot aztan raengedem, ez a best bullshit generator ever! de viccet felreteve, tenyleg megerti mirol szol a tema, vannak egesz jo otletei, es pl. olyanokat is eszrevesz (based on context) ha pl valahol elirtam egy tipuskodot.

> Nem. Ha a felhasznált művek licenszfeltételeit betartod, és engedélyt kapsz a jogtulajdonostól

szerinted 1-1 muvesznek mindnekitol van engedelye, akinek a muveibol tanul, inspiralodik?

3 szavazat

A hozzászóláshoz be kell jelentkezni

szerinted 1-1 muvesznek mindnekitol van engedelye, akinek a muveibol tanul, inspiralodik?

Tegnap este szűk körben én is érveltem, csak a tanárokat hoztam fel, akik átadják a tudásukat.

Miért fizetést kap? Miért nem kap az oktatás alatt diákoktól havonta 10.000 forintot? (az összeg csak példa). A diákok akik sikeresek lesznek az életben, miért nem fizetnek jogdíjat a kapott tudásért az adott tanárnak?

És hasonlók.

Dehát ezek bonyolult dolgok.

1 szavazat

A hozzászóláshoz be kell jelentkezni

egyreszt abban egyetertek, hogy nem kene jogilag vedeni az outputot

A hatályos jogszabályok és a saját ToU-juk alapján ez egyébként nem is lehetséges, az benne a pláne.

masreszt ha egy ember inspiralodva masik muveibol alkot valamit, azt alanyi jogon vedi a szerzoi jog, nemde?

Ácsi! Az inspirálódásra felhasznált művet is éppúgy alanyi jogon védi a szerzői jog, nemcsak az "inspirálódott" művet.

szerinted 1-1 muvesznek mindnekitol van engedelye, akinek a muveibol tanul, inspiralodik?

Szerinted minden tilosban parkoló lebukik? Igen, bizony mindekitől kellene lennie engedélyének (amennyiben a felhasznált mű nem közkincs, és az eredeti szerző explicit nem licenszelte). Ha nincs, akkor az eredeti szerző bizony beperelhet a bíróságon (aztán majd a bíró eldönti, hogy mennyire is "inspirálódás" vagy inkább lopás-e, amit tettél és hogy seggbe kell-e érte kúrni egy gumibottal vagy sem.)

Csak azért, mert az eredeti szerzőnek van jobb dolga is annál, mint hogy minden egyes engedély nélküli művészt feljelentsen a bíróságon, attól még nem lesz morálisan vagy legálisan helyes engedély nélkül más műveit felhasználni.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Itt több jogi probléma is adott.

1, Jogvédett anyag letöltése, feldolgozása, tárolása. A legtöbb országban a szerzői jog szabályozza hogy mit lehet és mit nem. Ez országonként különbözik. Itthon például lehet másolatokat készíteni magáncélra, pénzszerzési cél nélkül, viszont ezért cserébe fizetjük a reprográfiai dijat amiből a szerzőket kell(ene) kárpótolni. Ez itthon odáig megy hogy akár filmeket is le lehet tölteni amig magáncélra csinálod, Németországban ezért pár ezer eurós birságok repkednek.

2, Ha a jog engedi is a másolat készítést, azt nem hozhatod nyilvánosságra, ahhoz engedély kell. Tehát hiába van fent mondjuk egy fotó egy honlapon azt te nem töltheted le és rakhatod ki a saját honlapodra, vagy blog postba, vagy akárhova. Erről bővebben itt lehet olvasni:

https://jogaszvilag.hu/szakma/hogyan-hasznalhatok-a-netrol-masolt-fotok/

3, USA-ban van egy olyan szabály hogy fair use. Ez elég bonyolult, de nagyjából azt a célt szolgálja hogy ha lehessen kutatni, hivatkozni, stb. dolgokat, tudjál kritikát írni, stb. Ez lehetőséget ad arra hogy ne kelljen engedélyt kérni egy adott mű használatához a szerzőtől. De, ahogy lent elolvashatod, ez üzleti célnál egyáltalán nem áll meg, illetve nem arra volt kitalálva hogy fogjuk az összes elérhető irott anyagot és ezt bedigitalizálva feldolgozzuk.

https://copyrightalliance.org/faqs/what-is-fair-use/
https://copyright.psu.edu/copyright-basics/fair-use/

4, származtatás: ha fogsz egy művet és átdolgozod, akkor arra is külön szabályok vonatkoznak, a szerzői jog a tiéd lesz, viszont kell az eredeti szerzőtől engedély:

https://jogaszvilag.hu/szakma/atdolgozas-feldolgozas-forditas-ki-minosu…

Nézzük a problémákat az LLM-ekre vonatkozóan:

- Azokat az anyagokat amelyekből tanítanak jogszerűen szerezték-e be? A válasz az hogy valószínűleg nem, szerzői jogot sértve szereztek be és tároltak.
- Jogszerű volt-e az anyagok feldolgozása: itt is az a válasz az hogy valószínűleg nem.
- Történt-e jogvédett anyagok megosztása a részükről? Igen, bizonyos esetekben balfaszok voltak és simán visszatorrenteltek több GB-nyi könyvet. Helló Meta. Hogy ez miért problémás? Azért, mert az USA-ban ennél kevesebbért kapott valaki több évtizedes börtönbüntetést.
- Képes-e az LLM hogy komplett részleteket visszaadjon? Igen, természetesen képes, bizonyos esetekben viszont figyelik a prompt-okat és tiltják a válaszadást, ezzel próbálva kicselezni a szabályozást.
- Ha az LLM visszaad egy eredményt, akkor annak ki a szerzője, ki a jogtulajdonos? A jelenlegi szabályozás alapján, mivel nem történt emberi közreműködés, ezért ezek a kimenetek nem állnak szerzői jog hatálya alatt. Ebből viszont következik egy dolog amiről nem akarnak beszélni: te, mint a fejlesztő, SEM leszel jogtulajdonosa a kódnak, tehát nem is mondhatsz le róla a céged részére. Tehát a kódbázis tele lesz olyan kódrészletekkel, amelyet a céged nem birtokol, tehát ha ez kikerül a netre és használtok a cégnél LLM-et, és valaki ezt úgy ahogy van ellopja és felhasználja, akkor neked kéne bizonyítani hogy az adott kódrészleteket ember írta és nem gép, tehát neked, mint cég, szerzői jogod van a kód felett. Ez egy baromira kellemetlen helyzet lehet, és nincs rá még se folyamat, se precedens.

3 szavazat

A hozzászóláshoz be kell jelentkezni

> Képes-e az LLM hogy komplett részleteket visszaadjon? Igen, természetesen képes

csak annyira kepes mint egy ember. valoszinu par hires dalszoveget, ismert verset, himnuszt stb mindenki vissza tudna mondani fejbol, de barmit amit valaha eleteben tanult, olvasott nem sokan. az llm-ekben nincs tarolva 1:1-ben a tanitasahoz hasznalt anyag, nincs adatbazisa ahogy sokan ezt elkepzelik. neuron suly ertekek vannak, ami alapjan szavak egymas utani valoszinuseget tudja becsulni, ez csak akkor fog pontosan idezni barmit is ha az rengetegszer, NAGYON sokszor elofordult a tanitasahoz hasznalt inputban, es igy "beegett" a haloba.

Raadasul az LLM-ek tanitasahoz hasznalt text input sok 100 TB mennyisegu (csak a CommonCrawl evekkel ezelott 500TB korul volt), mig a legnagyobb LLM modelek is max 2-3TB meretuek.

a kepgeneraloknal meg szembetunobb, az SD 1.x-et 600 millio fotoval tanitottak, a kesz model csak 2 GB volt. ennek ellenere egy Mona Lisat egesz jol meg tudott "festeni", sot sok vizjelet is megtanult es random kepekre rarakta oket, neha meg ala is irta a muveit valaki neveben... sot megtanulta a jpeg tomorites artifactokat is, sikerult direkt szar minosegu kepeket is generalnia. ezekbol csak az latszik, ha valami eleg sokszor szerepel az inputban, az beeg a modelbe.

Itt van Sándor Petőfi "Anyám tyúkja" című versének első 4 sora:

Hejj, mi a kó, tyúkanyó kend?
Miért olyan szomorú, miért olyan kend?
Meglőtték a tyúkod, vagy a kertedet?
Vagy talán a szomszédod a szemétet?

Speed: 1.2 t/s

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ez részben igaz, de:

https://arxiv.org/abs/2012.07805

https://not-just-memorization.github.io/extracting-training-data-from-c…

Itt ugye az is gond hogy a modellben (adatbázisban) benne vannak személyes adatok, név, telefonszám, stb. Ez kapásból GDPR sértés!

Illetve a lényeg nem csak az hogy van egy LLM modelled, hanem van egy komplett cég mögötte, amely rengeteg adatot letölt, tárol, és feldolgoz. Ez az a pont ahol a szerzői jog mindenképpen sérül, nem (csak) a modell esetében.

0 szavazat

A hozzászóláshoz be kell jelentkezni

> benne vannak személyes adatok, név, telefonszám, stb. Ez kapásból GDPR sértés!

de mar azota hogy kikerult a webre. az AI csak megtanulta onnan... abban van igaza a tanulmanynak hogy az AI-bol nehezebb torolni, mint webrol (nem mintha onnan igazabol lehetne, ugye annyi keresmotor, archive.org, commoncrawl/webtext/stb van)

> rengeteg adatot letölt, tárol, és feldolgoz

mondjuk lattam mar olyan megoldast ahol valamelyik datasetet streamelve toltak be az ai-ba, nem taroltak lokalisan (azert egy 500TB-os commoncrawl-nal az sem trivialis mar hova mented le)

0 szavazat

A hozzászóláshoz be kell jelentkezni

500T az nagyjából két polcnyi lemez.

Olcsónak nem olcsó, de triviális.

0 szavazat

A hozzászóláshoz be kell jelentkezni

most mar talan, de kb 6-7 eve meg nem volt az, 8tb diskekbol kellett volna vagy 100db hozza. es akkor az meg csak a raw input, azt fel is kell dolgozni valahova, szoval 2-3x ennyi tarhely kell.

es akkor meg ugy eott tartunk hogy letolteni gyorsabb mint kiirni a diskre. bar egy jo hw raid kartyaval talan mar ez is megugorhato.

1 szavazat

A hozzászóláshoz be kell jelentkezni

6-7 évre visszatekintve, és teljes adatutat tekintve teljesen jogos.

Én 15-30G méretű driveokra gondoltam, viszont gyors rákeresve a "végtelen pénzből megvehető" (https://premioinc.com/products/flachesan2n108m-d5) hardwareket, találtam 108 lemezes edSFF storaget; feltöltve 60T diszkkel, az 6 exabyte nyersen.

Az előző mondatot leírva egyébként hirtelen úgy érzem magam mint Pistike a matekfeladatban a háromszázhuszonhat görögdinnyével....

2 szavazat

A hozzászóláshoz be kell jelentkezni

ha mar vegtelen penzbol, akkor legyen mar ssd, ne disk, abbol is valami enterspajz fajta :)

btw van mar 60T disk? en meg csak 2028-ra igeretet lattam, leragadtam a 20T-nel... es az se enterspajz annyira.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Erre gondoltam:

https://smicro.eu/solidigm-d5-p5336-61-44-tb-e1-l-nvme-4-0-x4-sbfpfwbv6…

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hát igen, ahhoz képest hogy az Apple-nél +7TB=2.750,00 € ahhoz képest a 61.44TB=6.156,13 € nem sok.

0 szavazat

A hozzászóláshoz be kell jelentkezni

És itt jön a probléma. Ugyanis azért mert én felrakom a honlapomra a nevem és az email címem nem jelenti azt, hogy te ezt a személyes adatot kezelheted a saját adatbázisodban. Erre ugyanis én nem adtam neked engedélyt.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A Claude okos kis jószág, fejőbl tudja a kötelezőt:

Hogy szól Petőfi SÁndor Anyám tyúkja" című versének első 4 sora?

Petőfi Sándor "Anyám tyúkja" című versének első négy sora így szól:

"Ej, mi a kő! tyúkanyó, kend A szobában lakik itt bent? Lám, csak jó az isten, jót ád, Hogy fölvitte a kend dolgát!"

Ez a vers Petőfi Sándor egyik legismertebb és legkedvesebb költeménye, amelyet 1848-ban írt. A vers a költő édesanyjához és a családi otthonhoz való ragaszkodását fejezi ki játékos formában.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ugyanez a prompt, Grok, DeepSearch nélkül:

"Anyám tyúkja, jer ide, Szép piros tojást tojj ide, Hadd süssünk belőle rántottát, Hadd egyék a kisangyalok máját."

0 szavazat

A hozzászóláshoz be kell jelentkezni

És akkor a pajzán Toldi még elő sem került... :-)

2 szavazat

A hozzászóláshoz be kell jelentkezni

Köszönöm a világosan kifejtett, érvelésekkel teli és forrásokkal alátámasztott, részletes okfejtést! Jó látni, hogy vannak még értelmes fórumtársak, nemcsak TROLLok!
Ez a színvonal lenne kívánatos a HUP-on szvsz.

De, ahogy lent elolvashatod, ez üzleti célnál egyáltalán nem áll meg

Pontosan! Üzleti tevékenységre nem érvényes a fair use.

Azokat az anyagokat amelyekből tanítanak jogszerűen szerezték-e be? A válasz az hogy valószínűleg nem, szerzői jogot sértve szereztek be és tároltak.

Erről tudjuk, hogy nem "valószínűleg nem", hanem egész "biztosan nem". A már lezárult pernél kimondta a bíróság kerek-perec, hogy konkrétan jogtalan volt. A többi folyamatban lévő perben is hasonló ítélet várható, lévén precedensjog van odaát.

Történt-e jogvédett anyagok megosztása a részükről? Igen, bizonyos esetekben balfaszok voltak és simán visszatorrenteltek több GB-nyi könyvet.

Nem kell olyan messzire menni, az LLM felülete és REST API-ja is folyamatosan megosztja az illegálisan begyűjtött anyagokat. Ahogy fentebb is demonstrálták, megkérheted, hogy idézzen egy szerzői joggal védett anyagot, és megteszi. (Egyébként sok más író mellett a Trónok harca írója is pont erre hivatkozva perli őket, nem a torrent miatt.)

Ha az LLM visszaad egy eredményt, akkor annak ki a szerzője, ki a jogtulajdonos?

Van erre amerikában egy törvény, ami egyértelműen kimondja, hogy a felhasználóé és a felhasznált adat eredeti tulajdonosáé a szerzői jog (semmiképp sem az LLM-et üzemeltetőé, mert a program licensze nem vonatkozhat a kimenetére).

ezért ezek a kimenetek nem állnak szerzői jog hatálya alatt

De állnak. Tényleg létezik egy olyan ajánlás, hogy az LLM kimenete ne állhasson szerzői jog védelme alatt, ez azonban csak ajánlás a hivatal részéről, a hatályos törvény továbbra is a 17 U.S.C.

És mégegy dolog, amiről eddig nem esett szó. Ha megszűnik a copyright védelem, és szabad lesz a rablás, akkor a kiadók egyszerűen nem tesznek majd fel semmit a netre, és minden netes megjelenés miatt szarráperelnek mindenkit (pont ahogy most a Pirate Bay-t vagy épp az Internetarchive-ot szarrá perelték, csak ezután válogatás nélkül mindenkit fognak perelni). Szóval ennek az lesz a vége, hogy az LLM-ek meg jól beszopják, mert pont az ellenkező hatást fogja kiváltani: több anyagot akarnak, de még kevesebb lesz.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ha egy szoftver forráskódjának a szerzője megszabhatja, milyen formában használható fel a kód – amivel gondolom egyetértesz – miért ne vonatkozna ez bármilyen más IP re is?

0 szavazat

A hozzászóláshoz be kell jelentkezni

A "bármely más" itt off-topik, ebben a topikban konkrétan azokról van szó, akik maguknak ingyen inputot szeretnének, és pénz kérnének az outputért.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Pont ezt mondom én is, hogy sebészien ott húznák meg az IP védelem határát, ahol a legtöbbet vehetnek ki belőle. Ez önkényes, piactorzító...

0 szavazat

A hozzászóláshoz be kell jelentkezni

ott húznák meg az IP védelem határát

Ez politikai szabályozás, nem üzleti kérdés.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Ami még véletlenül sem befolyásolnak üzleti érdekek, mint az köztudott.

1 szavazat

A hozzászóláshoz be kell jelentkezni

Nos, nyilván az emberi tudatlanságnak nincs határa, meg a lájkoló therion haverod is ilyen. Határtalan tudatlanság azt feltételezni hogy politika nélkül létezik pénz.

De ha nincs politika, helyettesítheted a "politika" szót pl.

Vallási vezető
Törzsfő
Fegyveres dominancia
Vagy simán a legnagyobb kutya diktál

Bár azt hiszed kurva okosat mondtál, valójában jobb lenne ha kimaradnál a témából, és nem terjesztenéd a hülyeséget. Bár a modern világban a pénz és a politika gyakorlatilag össze fonódott, néha már úgy tűnik, mintha a pénz lenne a politikai vonzás maga. De ez lobbi, korrupt, befolyásolható politikus, ahol akié a pénz azé a mikrofon, vagy ahol a pénz durván irányított egy vagy több politikai döntést, stb.

Tehát amikor azt írod

Ami még véletlenül sem befolyásolnak üzleti érdekek, mint az köztudott.

akkor a korrupció melegágya az amiről beszélsz, és a gazdagok uralma, tolvajállam, kevesek uralma, autokratikus kapitalizmus és még sorolhatnám.

Az amiről te beszélsz, az a választás látszólagos joga, ha a látszólagos demokráciáról beszélsz.

Nagy dilemma, hogy

a pénz eszköz lett a hatalom megszerzésére
vagy a hatalom eszköz lett a pénz megszerzésére

De ilyen elismerően nyilatkozni a diktatúráról, ősközösségről, azért veszélyes dolog.

Még jó hogy látszólagos szólásszabadság van.

De egy biztos, politika nélkül nincs pénz, pénz nélkül nincs befolyásolás. A pénz csak akkor stabil és működőképes, ha van mögötte valamilyen politikai struktúra. A mai világban a "közösségi megegyezés" amivel helyettesíteni lehetne az működésképtelen, mert túl demokratikus, viszont ott van a létező másik véglet, a birkanyáj, amelyik olyan mint itt a hup nagy része trey vezetésével.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Van szükség IP védelemre ahhoz, hogy a pénz létezhessen? Nincs. Tehát csak sok szót írtál a semmiért. Nem értem, mit nem értesz.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Határtalan tudatlanság azt feltételezni hogy politika nélkül létezik pénz.

Határtalan tudatlanság azt feltételezni, hogy politika kell a pénzhez. Nem kell.

A gazdaság köszöni szépen, elvan politika nélkül (pl. feketepiac), de még hivatalos érmék nélkül is (számtalan példa van erre a történelemben, pl. kagylót, gyöngyöt stb. használtak érmék helyett, de hogy divatosat mondjak, bitcoin-hoz sem kell politika). Sőt, a gazdaság akkor pörög a jobban, ha a politika egyáltalán nem szól bele.

0 szavazat

A hozzászóláshoz be kell jelentkezni

A teruleten dolgozom pillanatnyilag.

A gond az, hogy irtozatos verseny van most az LLM-eket train-elo cegek kozott. Aka, aki lemarad, az kimarad.

Ilyen 'forro' piaci helyzetben gyakorlatilag mindenki, mindenhol rugalmasan kezeli a szabalyokat. Ez nem LLM vagy amerika-specifikus; egyszeruen nyomas alatt kisebbnek tunnek a masok ugyes-bajos apro-csepro dolgai, bajai. Emberi tulajdonsag.

Az ma mar kozismert, hogy a robots.txt es hasonlo file-okat totalisan ignoraljak, es barmifele szurke-fekete forrasbol beszerzett anyagot is felszippantanak (ugye emlekszunk, hogy az openai lebukott a library.org -rol toltott anyagokkal?)

De meg ez sem eleg. Ma mar konkretan a training material jelentos resze, 80-90% -a mestersegesen eloallitott szoveg.

Illetve akar egymasrol is tanitjak egymast, emlekszunk, amikor az openai a deepseek-et vadolta azzal, hogy azert lassuak a szervereik, mert a deepseek rajtuk train-eli a modelljet?

De hogy nemi perspektivaba helyezzuk a dolgot.

Minap volt szerencsem par kollegat latni, ahogy egy hosszura nyult munkanapig sikerult megszerezniuk egy H100-as node-ot az AWS-en, tesztelni a deepseek-r1 modelljet.

Potom 700 dollar volt. Par napos varakozasi ido utan, mert annyian akarnak brutal gpu-t.

Igy mennek a dolgok LLM-foldon. Es ezert van az, hogy holmi robots.txt, 1-2 per az o szemszogukbol 'meh' kategoria.

Ahogy mondtam, aki lemarad, az kimarad. Ez pedig a kovetkezo evtizedek "nagy dobasa" lesz, amibol senki se akar kimaradni; se cegek, se orszagok.

Erdekes evek ele nezunk...

1 szavazat

A hozzászóláshoz be kell jelentkezni

Köszönjük a hasznos belsős nézőpontot! Némi ellentmondást vélek felfedezni, azt írod, "aki lemarad, az kimarad", de miről is maradnak tulajdonképpen le, ha - amint szintén írod - "training material jelentos resze, 80-90% -a mestersegesen eloallitott szoveg"? Ez nekem már most csuka fogta róka, róka fogta csuka esetének tűnik.

Én csak azt nem értem, hogy ezzel a "szabad lopnunk" elvvel nyilván az a cél, hogy több anyagot szippantsanak fel, na de ha a szerzőket nem védi a jog, akkor egyszerűen nem fogják majd felrakni az új anyagaikat a netre (max. paywall mögé vagy proof-of-work captcha mögé). Így végeredményben csak még kevesebb anyag áll majd a rendelkezésükre, mint most, és ha a betanításnál eléri a 100%-ot a mesterségesen előállított szöveg, akkor mi értelme marad az egésznek?

Szerintem hosszú távon nagyon kontraproduktív ez a féktelen mohóság, maguk alatt ássák a sírt. És hát az egész internet alatt is.

0 szavazat

A hozzászóláshoz be kell jelentkezni

> de miről is maradnak tulajdonképpen le

hat az evszazad uzleterol.

>> training material jelentos resze, 80-90% -a mestersegesen eloallitott szoveg

ezzel nem ertek egyet. nagyon komolyan szurik ezeket a datasetbol (mivel tele a web vele), szandekosan pedig biztosan nem rakjak bele. hamar belterjes lesz a model, ha ezt hagynak. foleg 89-90%-ot. forditva esetleg lehetseges, hogy 80-90% a tiszta input, a maradek az ai/szemet. es meg az is eleg sok.

> akkor egyszerűen nem fogják majd felrakni az új anyagaikat a netre (

dehogynem. mivel ok is ai-vel iratjak mar ugyis... :)

> És hát az egész internet alatt is.

az internet mar akkor megdoglott, kb 30 eve, amikor mindenkit rakapcsoltak...

0 szavazat