Itt több jogi probléma is adott.
1, Jogvédett anyag letöltése, feldolgozása, tárolása. A legtöbb országban a szerzői jog szabályozza hogy mit lehet és mit nem. Ez országonként különbözik. Itthon például lehet másolatokat készíteni magáncélra, pénzszerzési cél nélkül, viszont ezért cserébe fizetjük a reprográfiai dijat amiből a szerzőket kell(ene) kárpótolni. Ez itthon odáig megy hogy akár filmeket is le lehet tölteni amig magáncélra csinálod, Németországban ezért pár ezer eurós birságok repkednek.
2, Ha a jog engedi is a másolat készítést, azt nem hozhatod nyilvánosságra, ahhoz engedély kell. Tehát hiába van fent mondjuk egy fotó egy honlapon azt te nem töltheted le és rakhatod ki a saját honlapodra, vagy blog postba, vagy akárhova. Erről bővebben itt lehet olvasni:
https://jogaszvilag.hu/szakma/hogyan-hasznalhatok-a-netrol-masolt-fotok/
3, USA-ban van egy olyan szabály hogy fair use. Ez elég bonyolult, de nagyjából azt a célt szolgálja hogy ha lehessen kutatni, hivatkozni, stb. dolgokat, tudjál kritikát írni, stb. Ez lehetőséget ad arra hogy ne kelljen engedélyt kérni egy adott mű használatához a szerzőtől. De, ahogy lent elolvashatod, ez üzleti célnál egyáltalán nem áll meg, illetve nem arra volt kitalálva hogy fogjuk az összes elérhető irott anyagot és ezt bedigitalizálva feldolgozzuk.
https://copyrightalliance.org/faqs/what-is-fair-use/
https://copyright.psu.edu/copyright-basics/fair-use/
4, származtatás: ha fogsz egy művet és átdolgozod, akkor arra is külön szabályok vonatkoznak, a szerzői jog a tiéd lesz, viszont kell az eredeti szerzőtől engedély:
https://jogaszvilag.hu/szakma/atdolgozas-feldolgozas-forditas-ki-minosu…
Nézzük a problémákat az LLM-ekre vonatkozóan:
- Azokat az anyagokat amelyekből tanítanak jogszerűen szerezték-e be? A válasz az hogy valószínűleg nem, szerzői jogot sértve szereztek be és tároltak.
- Jogszerű volt-e az anyagok feldolgozása: itt is az a válasz az hogy valószínűleg nem.
- Történt-e jogvédett anyagok megosztása a részükről? Igen, bizonyos esetekben balfaszok voltak és simán visszatorrenteltek több GB-nyi könyvet. Helló Meta. Hogy ez miért problémás? Azért, mert az USA-ban ennél kevesebbért kapott valaki több évtizedes börtönbüntetést.
- Képes-e az LLM hogy komplett részleteket visszaadjon? Igen, természetesen képes, bizonyos esetekben viszont figyelik a prompt-okat és tiltják a válaszadást, ezzel próbálva kicselezni a szabályozást.
- Ha az LLM visszaad egy eredményt, akkor annak ki a szerzője, ki a jogtulajdonos? A jelenlegi szabályozás alapján, mivel nem történt emberi közreműködés, ezért ezek a kimenetek nem állnak szerzői jog hatálya alatt. Ebből viszont következik egy dolog amiről nem akarnak beszélni: te, mint a fejlesztő, SEM leszel jogtulajdonosa a kódnak, tehát nem is mondhatsz le róla a céged részére. Tehát a kódbázis tele lesz olyan kódrészletekkel, amelyet a céged nem birtokol, tehát ha ez kikerül a netre és használtok a cégnél LLM-et, és valaki ezt úgy ahogy van ellopja és felhasználja, akkor neked kéne bizonyítani hogy az adott kódrészleteket ember írta és nem gép, tehát neked, mint cég, szerzői jogod van a kód felett. Ez egy baromira kellemetlen helyzet lehet, és nincs rá még se folyamat, se precedens.