A VLC fejlesztői mesterséges intelligenciával támogatott, valós idejű feliratok megoldáson dolgoznak

Jean-Baptiste Kempf, a VideoLAN (VLC) alapítója és fő fejlesztője a CES2025-ön bemutatta, hogyan képes a VLC offline, helyben futó, nyílt forráskódú AI modellek segítségével videókhoz valós idejű feliratot generálni és azt több nyelvre fordítani. A funkció több mint 100 nyelvet támogat. ☝‍️

Hozzászólások

Szerkesztve: 2025. 01. 13., h – 10:37

RIP feliratok.org, hosszupuska stb.

Még egy állás, amit elvesz lassan az AI ...

trey @ gépház

Nem hiszem.
Magyar nyelvre fordítani egyik AI modellnek sem megy túl fényesen. Alapokat lefordítják úgy ahogy, de minden esetben utómunkálatok kellenek hozzá, hogy értelmes illetve jó is legyen. 
Ugyan nem offline, hanem online AI alapú feliratoldal : SubtitleCat . A magyar nyelv nem az erőssége, viszont a világnyelvekről angolra nagyon korrektül fordít.

Ne temessük (még) a magyar feliratos oldalakat.

I don't run often, but when I do, I run as administrator.

Magyar nyelvre fordítani egyik AI modellnek sem megy túl fényesen.

Attól tartok, hogy ez nem feltétlenül lesz akadály, sőt. Nézd meg az átlag magyar hozzászólót/huput/"újságírót"/"tartalomkészítőt", hogy milyen "nem túl fényes" színvonalon használja a magyar nyelvet. És ez még nem fordítás, ez csak a magyar nyelv használata. Ehhez a nyelvi "színvonalhoz" nagyon is megfelelhet a hasonló szintű gagyi fordítás, sőt, talán könnyebben is fogják felismerni és "érteni". És akkor egy újabb szereplő kapcsolódik be az ördögi körbe, aki (/ami...) szintén gyatra szöveget gyárt, amit sokan fognak látni, egy részük helyesnek is tartja, tehát ők is ezt használják és terjesztik, amit megint csak többen fognak látni (az MI pedig ebből is csak azt szűri le, hogy "jó" az, amit csinál stb.) ...

Nem hinném, hogy elvesz, eddig sem volt a feliratozásban olyan nagy biznisz, megélhetés. Meg sose lesz az AI 100%-os, ebben a tekintetben sem, embernek mindig kell ellenőriznie, de el kell ismernem, hogy ez az a műfaj, amire az AI jó, erre kivételesen megéri valóban használni. Ilyen írásfelismerés/OCR, arcfelismerés, feliratozás, zajszűrés, átméretezés (FSR, XLSS, DLSS, stb.).

The world runs on Excel spreadsheets. (Dylan Beattie)

Imadom amikor mondjuk egy filmebnb leforditjak: "Do you like Red Hot Chilli Peppers?" -> "Szereted a forro voros chilli borsot?" :D es ez meg csak a teteje, a jeghegy alja jo melyen van es hatalmas :D

J< ezt emberek forditjak igy. Lehet az AI nem forditana le :D

Es ehhez mekkora binaris blobokat kell letolteni localba?

Jó nagy off, de olyat szeretnék, hogy a google translate elmentett szavakat AI megtanítsa :D Nem tud valaki valami ilyet? 

Szerkesztve: 2025. 01. 13., h – 15:35

Sajna ez a valosag, a forditasban 70%-os pontossagig real-time el fogunk jutni 3-4 ev mulva. Igy igaz az, aki azt mondja, a tolmacsoknak, a nyelvtanaroknak es a hosszupuskanak meg vannak a napjai szamlalva! Lehet itt kotozkodni, de ez a valosag. Persze nem Goethe muveket fog forditani tokeletesen a cucc, de a tarsalgasi nyelvet tudni fogja. 3 ev mulva jonnek a kutyuk a fuledbe, amik online forditanak!

A 70% pontosság az elég gyatra. Az AI a tolmácspiacot is biztosan át fogja rendezni, de ha 30% esély van arra, hogy baromságot mond, akkor még azt sem bíznám rá, hogy kérjen útbaigazítást a helyi kocsmáig, nemhogy mondjuk rábíznék egy üzleti tárgyalást. :)

Igen, ahol szamit a pontossag illetve a kifejezokeszseg (tolmacsolas, irodalom, muforditas, stb) ott az AI nem fog labdaba rugni meg sokaig lehet (aztan kerdes mennyi az a sok). De a napi kommunikacioban az a -30% nem sok. Az egy atlagos londoni bevandrolo angolja vagy egy magyar mayarja az utcan. :D

Illetve itt is igaz, hogy mi a megterules. A peldadban egy kocsmahoz kersz eligazitast. Lehet masikba kuld, de a megterules az rendben van :D (tolmacsolasban mar nem lenne okes, hogy a "ne nyomd meg a gombot" helyett "ne, nyomd meg a gombot" lenne :D

az emberi tolmacs is mondhat baromsagot. az ember is elkuldhet a buzibarba a kocsma helyett. annyi csak a kulonbseg, hogy az embert meg tudod verni erte :)

uzleti targyalasnal meg ritkan szoktak tolmacsozni, mindig van egy kozos nyelv (pl angol), amit mindket fel beszel... a lenyeg meg ugyis irasba kerul es majd egy sereg ugyved atnezi.