Webtartalom indexelés jogi háttér

Sziasztok,

Adódott egy ötletem, amely nem újkeletű, de mégis egyedi, ugyanakkor kétségeim vannak a jogi háttérrel kapcsolatban.

Az ötlet lényege, hogy adottak A.hu, B.com, ... Z.net weboldalak (főleg magyar, de később lehet külföldi is), amelyek bizonyos típusú tartalmat szolgáltatnak. Ezeket a tartalmakat szeretném indexelni, de nem a szokványos "kövessük a linkeket, nézzük meg milyen szöveg van rajtuk és építsünk DB-t" hanem adott metaadatokat szeretnék kinyerni ( terméknév, teljesítmény, ár, gyártó, modell, stb. ), majd az indexelt tartalmakat egy könnyen (és egységesen) kereshető formában megjeleníteni - megjelölvén a forrást is, direkt linkkel a találatoknál. (Tudom, hogy az ötlet nem supernatural, sokaknak mégis jól jönne.)

Bevételt én ebből nem generálnék, ez gyakorlatilag egy mashup v. metasearch engine lenne, a cél a könnyebb keresés ( lásd Google, ).

Namost a weboldalak legtöbbje ÁSZF-ében leírja, hogy a közölt tartalmakat szerzői jog védi (amelyet az 1999. évi LXXVI. törvény a szerzői jogokról is kimond). Van olyan eset is, ahol kifejezetten megtiltják az automatizált letöltést, "adatbázis részleges vagy teljes másolását" (hát mondjuk ki, igazából közvetve tényleg erről van szó), és minden polgári, büntetőjogi lépést megtesznek, bla-bla. Teljesen érthető, védik az adataikat, én is ezt tenném.

A kérdésem az, hogy jól tudom-e, hogy ez tényleg szerzői jogokat sért? Azaz ha tényleg indítanak egy eljárást, azt 100% hogy elveszteném? Vagy a mashup oldalak valamilyen kiskaput játszanak ki? Mik ezek a kiskapuk, amelyek levédenének?

Másrészt egy keresőrobotra milyen szinten érvényes az ÁSZF? Felhasználónak minősül egy keresőrobot?
Tudtok-e ilyen precedensről, hogy mashup-okat beperelnek, lecsuknak, becsuknak?

Vagy lehet arra játszani, hogy megcsinálom a nagy indexelést, kiteszem a netre, jó sokan rájönnek, hogy milyen jó (jó esetben), és aztán már a siteoknak is érdekük lesz, hogy indexeljem őket? (ismét lásd Google, Yahoo, Bing)

Hozzászólások

Ha az oldal robots.txt fájlában vagy a lapok "meta tag"-jeiben tiltva van az indexelés, akkor a Google, Yahoo és számodra sem lehet adatok gyűjteni onnan. Ellenkező esetben szerintem bármit indexelhez azokon az oldalakon csak legyen link arra az oldalra. Ez egy személyes vélemény, lehet, hogy jogilag nem lehet.

+1 a robots.txt-re.
Hiába a jogi rizsa*, ami valszeg copy-paste-tel került oda, vagy kiadták egy jogásznak aki netet még sose látott. Ugyanis ha te betartod a robots.txt és html meta ajánlásaikat, de ők nem ebben nem kérik tőled vagy a nagyvilágtól, hogy mellőzd az indexelést, akkor, nincs jogi alapjuk a panaszra.

*: nem vagyok jogász, de azt hiszem ezt úgy hívják hogy ráutaló magatartás. Egy taxisnak sem mondhatod a fuvar végén, hogy nincs szerződés, te csak beültél a taxiba melegedni :) De ráutaló magatartás az is, ha egy szerződésben az egyik fél neve el van írva, de mégis évekig úgy járnak el a szerződött felek, ahogy a szerződésben írva vagyon, akkor később nem mondhatja, hogy dehát ez a szerződés nem is érvényes mert nem az a cég. Ráutaló magatartás ez is.

IANAL.

Igaz, hogy a Google letölti a fél internetet, és masszív haszonra tesz szert, de nem közli egyben az indexelt lapok tartalmát. Félmondatokat idéz be a keresésed alapján, meg egy linket tesz ki, és ennyi. Ezt szabályozza a robots.txt, és ennyi, ha nem tiltják meg, hogy letöltsd, akkor töltsd le nyugodtan, hiszen pont azért van kint a neten.

Amit te akarsz, vagyis adott oldalon levő adatokból új adatokat előállítani, és ezt leközölni, az már egy eléggé más dolog. Nézd meg az adott oldal jogi infóit, helyzettől függ. Ha nem engedik ezt explicite, az szerintem szerzői jog sértés. Származott mű, vagy mi.

--
joco voltam szevasz

Én sem közölném az indexelt lapok tartalmát egy az egyben. Például hosszú szöveges leírásokat, kommenteket sem. Ugyanakkor ettől még az adatbázisuk egy jelentős/jelentéktelen (ki tudja mit jelent ez a törvényben?) részét másolom, némely adatot módosítok (pontosítok, pl. EUR-HUF oda-vissza konverzió ). Ilyen alapon mikor a Google automatikusan lefordítja az indexelt lapot, az is módosítás! És ráadásul hiteltvesztően is módosíthatja...

Egyrészt nem szalad senki rögtön a bíróságra, ha nem tetszik nekik valami akkor szólni fognak elöbb, hogy tüntesed el az oldaladról ami az övék. A másrészt annyit megtehetsz, hogy írsz nekik előre egy mailt, amiben kéred az engedélyüket, hogy a spidered indexelhesse az oldalukat. Jó eséllyel lesz valami feed -jük is amiből egyszerübben kinyerheted az adatokat. Amúgy saját használatra szerintem minden további nélkül indexelhetsz. Aztán ha kész az oldalad, akkor írsz nekik. Azért arra figyeljél, hogy a spider ne terhelje túl az oldalakat, mert azt nem fogják díjazni.

Szerzői jogi szempontból két fogalom van, ami védelemben részesül:
- mű: itt az egész "alkotásnak" van védett értéke, azonban semmilyen körülmények között nem tekinthető a mű védett részének a bennefoglalt információ, azaz a szerzői jogi védelem védi mondjuk az index címoldalát komplett, de azt nem, hogy miről szól az az oldal; plusz ezen felül van még a szabad felhasználás fogalma is,
- gyűjteményes műnek tekinthető adatbázis: itt a speciális szempontok szerint összeválogatott, elrendezett, szerkesztett információhalmaz egésze (mint mű, mint alkotás) élvez védettséget; azonban a gyűjteményes mű fogalma úgy van megszövegezve, hogy a gyűjtemény jogán nem kap védettséget a gyűjtemény alkotórésze. Tehát míg pl. az argep.hu teljes adatbázisa védett műnek tekinthető, hiszen egyedi szempontrendszer alapján válogatták a más helyről származó információkat, addig a benne feltüntetett egyes konkrét adatok nem. Persze ha a gyűjteményes adatbázisban szerzői jogilag védett művek vannak/lennének, akkor minden ilyen mű külön-külön is védett, pluszban maga a teljes adatbázis is élvez védettséget.

Az én álláspontom szerint kereskedelmi árlistákban leírt árinformációkat szerzői jogilag nincs mód védeni (ebbe beletartozik a termék kereskedelmi megnevezése: gyártó/típus/modell, az azonosításhoz valamint a funkcionalitásának leírásához szükséges szöveg, valamint az ár is).

Ez persze csak az egyik oldal, van a dolognak egy technikai oldala is: nagyon könnyen meg tudja oldani egy cég, hogy hatékonyan ne tudjad az áraikat, termékkínálatukat az akaratuk ellenére gépi úton kimásolni rendszeresen. Emiatt célszerű erről velük előtte megállapodni, és akkor ez az egész probléma nem is fog létezni. Egy jól működő, kereskedelemből élő cég amúgy is érdekelt abban, hogy minél több vevő megtalálja. Viszont jó eséllyel garanciákat fognak követelni, hogy mindig aktuális információk jelenjenek meg, hiszen az számukra hitelvesztés, ha valótlan adatok alapján találnak oda hozzájuk a kuncsaftok, ill. pénzügyi veszteség, ha a valótlan adatok miatt oda sem mennek hozzájuk a kuncsaftok.

A magánjellegű véleményem a dologról: jó ötletnek hangzik, de értelmes információt nagyon sok terméktípus esetén nem fogsz tudni csak kézi (ergó rettentő költséges) úton beírni az adatbázisodba. Kevés cég van, akinek a termékeiről olyan szintű elektronikus leírás akad a neten, hogy azt egy sw fel tudja dolgozni.

Mert mostanság beleástam magam több technológiába, külön-külön meglévő moduljaim vannak, és azokat szeretném integrálni egy olyan szolgáltatássá, amely nem csak nekem, de másoknak is esetleg hasznos lehet. Tudom, hogy ha magáncélra csinálom, akkor semmiféle jogi akadálya ennek nincsen, de mivel szeretném közzétenni, ezért már kell ezzel is foglalkozni.