A YouTube kéretlenül AI-val barmol bele a shorts videókba

A feltöltő tájékoztatása és engedélye nélkül AI-vel méretez át a Google, részletek ebben a videóban, amely egy gitárcsatornáról származik, de érint minden feltöltőt.

Hozzászólások

Úgy, hogy amint feltöltik azután már nem a feltöltő kizárólagos tulajdona. YT, Google azt csinál vele amit akar. Reklámot eddig is tett bele, az is az eredeti videó megváltoztatása...

Ami azt illeti a YT az utóbbi 1-2 hétben elkezdte komolyan keverni a biztosítékot. Rengeteg szart erőltet a felhasználóra (shorts videók, értelmetlen képek, amiket nem lehetjeltűntetni, kérdőíveket dob fel, amik szintén nem eltűntethetőek) Nálam hamarosan megy a levesbe a YT, mert egy erőszakos, kellemetlen platform lett.

1.: bár az összes shorts menne az emésztőbe, vagy legalább beállíthassam, hogy ne erőltesse rám a tecső.

2.: hát egyelőre úgy tűnik, hogy küzdenek a szüksége sávészélesség csökkentéséért, ami egyfelől érthető.

Szóval... keresek olyan peertube platformot, ahol sok a macskás videó, és akkor kb. elfelejtem a tecsőt.

Ráadásul a shorts-ot tartalomkészítő oldalra is a YT erőltette rá. Amikor bevezették (nyilván a Tiktok ellen), sok készítő panaszkodott rá, hogy muszáj csinálnia, különben durván lerangsorolja a csatornáját az algoritmus.

Régóta vágyok én, az androidok mezonkincsére már!

Viszont mostmár kibaszás a shortsok. Gyorsan hoz sok feliratkozot, akiket viszont csak a shortok érdekelnek. Csinalja a rendes tartalmat, az kimegy x% feliratkozonak, ott viszon kevesen fognak rákattintani, mert őket a shortok érdeklik. Ez miatt a többinek már nem is tolja a tartalmat.

Igen, én is utálom ezt a Tik-Tok trendet, hogy mindenki ezeket az agynyomorító shortokat nyomja, YouTube, Facebook, összes szemét oldal. Csak az a baj, hogy itt nem a short-ok a lényeg, mert ezt várhatóan a teljes videóknál is be fogja húzni a Google, épp ilyen sunyi módon, hogy senkinek nem szólnak.

Így hiába lenne olyan tartalom, ami renden humán tartalom, professzionális feltöltőktől, AI szemetet csinálnak, hogy ne különbözzön az eleve AI által gyártott szeméttől, és néhány éven belül nem is lesz a neten rendes tartalom.

Windows 95/98: 32 bit extension and a graphical shell for a 16 bit patch to an 8 bit operating system originally coded for a 4 bit microprocessor, written by a 2 bit company that can't stand 1 bit of competition.”

Miért is gond az, hogy átméretezik? (Bocs, nem néztem meg a videót, a leírásból meg nem derült ki, mi a probléma igazából)

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával 

via @snq-

Ha jól értettem, akkor elsősorban az a baj, hogy AI-val, és ezzel is csak az a baj, hogy hányadék a végeredmény (nahát).

Viszont így szemre, a sok egybefolyó semmit jól lehet kvantálni, szóval hurrá sávszélesség. És/vagy lehet majd fizetni a nem annyira hányadék végeredményért, és addig is, van mivel etetni modellt.

Na nem mintha ezek bármelyike újdonság lenne.

A fene tudja, hogy ezzel nyernek-e sávszélességet. Az AI model bizonyos dolgokat elmos, más dolgokat indokolatlanul sharpen-el, bizonyos (eredetileg ott nem levő, vagy homályos) részleteket a saját tanítóhalmaza alapján tölt ki. Pl a fület a fenti videós példában.

Én arra tippelek, hogy inkább itt tesztelgetik az felhasználókon, hogy elég jó-e, statisztikailag változtat-e a nézési szokásokon (mennyire kell szarnak lennie, hogy már ténylegesen csökkenjen a nézettség), stb.

Régóta vágyok én, az androidok mezonkincsére már!

Igazából nem tudni pontosan mit akartak csinálni vele, mert akkor volna értelme az AI upscale-nek, ha az eredeti tartalom alacsony felbontású lett volna. Itt alapvetően nem régi 360p-s videókról van szó, hanem olyanokról, amik mostanában, eleve 1080p vagy nagyobb felbontásban lettek feltöltve.

EDIT: egy potenciális magyarázat jutott eszembe, hogy valójában egy kliens-oldalira tervezett upscale-elő modellt tesztelgetnek most a felhasználókon. Hogy később csinálhassanak olyat, hogy ők valójában egy 360p-s streamet szolgálnak ki és kliens GPU-ja csinálja a felskálázást.

Régóta vágyok én, az androidok mezonkincsére már!

Kissé demagóg módon, de akkor idelököm a pszichoakusztikus hangelnyomásra alapozó fantasztikus mp3-at. Az miben más e téren?

 

Vagy egyszerűen a digitális tartalmat, ami csak végtelen sűrűségnél (úgy értem mintavét és kvantálás) lesz nagyon hasonló az eredeti analóghoz.. pl. oszcilloszkópon jól felskálázva kijönne.

Vortex Rikers NC114-85EKLS

It depends on. Ha én a böngészőben egy eredetileg 360x360-as képet behelyezek egy <img style="width: 1024px; height: 1024px;" src="360x360.png" /> tagbe, megváltoztatom-e a tartalmat, amit a kép készítője előállított? Mert a böngésző hótziher hogy fel fogja skálázni a képet, és egy pixeles szarhalom lesz belőle. Sérül-e ezzel a szerzői jog?

Ha ennyire szűken értelmezzük a szerzői jogot és vidékét, nagyon sok már meglevő technológiánkat ki kellene dobni. Vagy az a gond, hogy az AI nyúl bele, és nem mondjuk az ImageMagick a maga kvantálási/resampling algoritmusaival? Miben másabb ez, mint az AI (ami részben valószínűleg ugyanezeket az algoritmusokat használja)?

A személyes véleményem az, hogy ha az AI nem ad hozzá új tartalmi dolgokat a képhez (ami eredetileg nem volt ott), csak szelektíven javít/ront rajta, azzal nem nyúl bele abba, amit a készítő előállított (pontosabban: nem változtatja meg a készítő szándékát a képpel). Sure, nem lesz mindenben egyező az eredeti képpel az előálló új tartalom, de például a thumbnail kép készítése során is megváltozik ilyen szempontból a tartalom mondjuk az Instagramon. Sőt, eleve a legtöbb üzenetküldő és szociális platform már feltöltéskor belenyúl a képbe, és átméretezi, levágja, stb., mégsem látok asztalt verő művészeket ezzel kapcsolatban. És ezek nem új technológiák, főleg nem új gyakorlatok, 20 éve is lekicsinyítettük és lerontottuk egy kép minőségét a thumbnail kedvéért. 

Tévedés ne essék, nem azt mondom, hogy az AI bevezetése minden esetben jó, de ezt a technológiát is megilleti az egyenlő bánásmód joga, ha valamire azt mondjuk, hogy az innentől nem jó, akkor a többi, meglevő technológiát is meg kell vizsgálni, hogy akkor az se jó-e, nem lehet valamilyen gyakorlatot csak azért hibásnak ítélni, mert az AI csinálja.

Az egy másik kérdés, hogy az így előálló átalakított tartalom minősége szar lesz, ahogy a 360x360-as kép 1024x1024-re átméretezve is szarul fog kinézni, erről lehet vitatkozni, lehet azt mondani, hogy az alogoritmusokon van még mit csiszolni, fejleszteni. 20 évvel ezelőtt a kép átméretező algoritmusok is sokkal szarabb minőségűek voltak, keresgélni kellett célprogramokat, amik már a fejlettebb, jobb algoritmussal méretezték át a képeket (hello, IrfanView, hello ACDSee), mára meg eljutottunk oda, hogy ez egy alap funkcionalitás lett, somewhat okés eredménnyel. 

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával 

via @snq-

> ha az AI nem ad hozzá új tartalmi dolgokat a képhez (ami eredetileg nem volt ott)

Na pont erről nem vagyok meggyőződve. A sima átméretezéssel semmi probléma nincs, ha az eredeti változatlanul elérhető. (Pl. thumbnail: az eredeti kicsinyített másolata, link az eredetire.)

Debian - The "What?!" starts not!
http://nyizsa.blogspot.com

Mintha a jog bármit is érne szakmai vélemények nélkül. Az informatika a jog számára nagyon új terület, és ami egy könyv vagy egy hanglemez esetében egyértelmű, az az informatikában már slippery slope is tud lenni. Akkor lehet jogi megállapításokat tenni, ha van megértés arról, hogy mi történik, mi változik.

Mondok egy példát: ha a könyvesbolt beleírja a könyv árát a könyv belső borítójára, az azért nem minősül szerzői jogi sértésnek, mert ezt valaki egyszer elmondta egy jogásznak, hogy a belső üres lap nem része a könyvnek mint jogi egységnek, az egy technikai szükség, hogy ott van (a másik oldalon van a borító), az ár beleírásával nem képződik másik mű. Ugyanez van a borítóra ragasztott árcímkével is. Ha a jogászokon múlt volna, a "szamárfüles" könyv értékesítése is szerzői jogi sértésnek minősülne.

Ahhoz, hogy megfelelő jogi szabályozás szülessen, fontos megérteni, hogy szakmailag mi történik a művel, mert az a jogász, aki ezen a területen nem jártas, nem fog tudni megállapításokat megfogalmazni sem. Ám ha a szakma sincs egy véleményen, abból mocsok nehéz jogi szöveget faragni.

Blog | @hron84

valahol egy üzemeltetőmaci most mérgesen toppant a lábával 

via @snq-

Idealizálod a helyzetet.

A jog egy közmegegyezés eredménye egy terület szabályozásáról, ami sok esetben eltér a természetesen adódó és technikai lehetőségektől (általában pont ez a lényege, olyan dolgokat nem igazán indokolt megtiltani, beszabályozni, ami amúgy is lehetetlen).

Persze ebben a közmegegyezésben általában vannak egyenlőbb felek a többieknél, akik gazdasági, politikai befolyásuknál fogva saját érdekeik irányába tudják elhúzni a szabályokat. Amit leírsz az leginkább a "tét nélküli" jogszabályokra igaz, ahol nem érdekkonfliktusban lévő felek között kell valahogy szabályokkal rendet teremteni. Gyakorlatban a jogszabályok elég kis része ilyen...

A szerzői jog talán ez egyik legextrémebb ellenpélda. Gondoljunk csak a "Mikiegér-törvényre" vagy a DMCA életszerűtlen, betarthatatlan és betartathatatlan rendelkezéseitől, ami teljesen egyértelműen a big-money szórakoztatóipari cégek lobbizásának hatására lett olyan, amilyen. És persze az amerikai lobbiérdek nemzetközi egyezményeken keresztül szépen ráerőszakolta az ezzel egyenértékű szabályokat a világ többi részére is.

A jelenlegi helyzetben sem az lesz a kérdés, hogy az AI modellen áthajtott képanyag matematikai alapon mennyire marad "hű" az eredetihez (pl az upscaler betartja-e az energiatételt), hogy ez megfeleltethető-e hagyományos fel-leskálázásnak vagy veszteséges képtömörítésnek. Hanem az, hogy kinek erősebb az érdekérvényesítő képessége. Van egy fogadásom, hogyha ez tényleges törvényhozási kérdéssé válik, akkor - az USA-ban legalábbis - a Big-tech simán ki fogja lobbizni, hogy önkényes döntéssel ez ne számítson a mű megmásításának. A szórakoztatóipari óriáscégek nem nagyon hiszem, hogy az ellenoldalra állnának (lásd tavalyi topic a témában: https://hup.hu/node/185595, látható, hogy a filmstúdiókat mennyire zavarja, hogy milyen esztétikai pusztítást végez az AI a filmjeiken...). Itt csak a kis tartalomgyártók meg esetleg a közönség igényesebb rétege állna az ellenoldalon, akiknek valószínűleg nem nagyon fognak lapot osztani a jogszabály megalkotásának kérdésében.

Az emberek többsége aki tiktok videókat pörget (300kbit/s-en full HD-ben, szigorúan csakis álló formátumban) és ha hirtelen megkérdeznéd tőlük, hogy a kettővel korábbi videón mit látott, akkor bután nézne (gen-Z stare ahogy ma trendy nevezni). Meg azok akik 10 éve default beállításon néznek tévét és nem zavarja őket, hogy a default bekapcsolt "szappanopera-filter" a filmeket 60fps-re interpolálja és katasztrofálisan néz ki az egész... Szerinted őket zavarni fogja? Szerinted egyáltalán érteni fogják mi a probléma az egésszel? 

Régóta vágyok én, az androidok mezonkincsére már!

Ahol én láttam, ott az volt a probléma, hogy az AI belenyúlt a videóba, és élesebbé, részletgazdagabbá tette, mint ami a forrás volt. Csak ezzel azt érte el, hogy pont úgy néz ki a videó, mint egy deepfake jelenet.
Az emberek arcán a ráncok, a hajszálak, a pólóján látható felirat élessége olyan lett, mint amit egy valós kamerával nem igazán lehet rögzíteni, és nem is mutat igazán jól.

Ahol én néztem, ott a tartalomkészítőnek nem azzal volt gondja, hogy belenyúltak, hanem azzal hogy emiatt silányabbnak tűnik a tartalma. És a silányabb minőséget a nézők majd nem annak fogják betudni, hogy az AI elrontotta, hanem annak, hogy biztos a feltöltő rontotta el. 

Nagy Péter

"Igazabol a TV keszulekekbe is kene valami. Igy a beszelo fej csak tatogna picit, es mindenki azt hallana, amit szeretne (az AI szerint)."

Szerintem ez lesz a következő lépés. Nem csak a hang, hanem a mozgókép is az egyénre lesz szabva, hogy minél hatékonyabban terelje arrafelé, amerre a hirdető szerint kell. És - még mindig - annak lesz igaza, akinek a legtöbb pénze van.