ne keverjuk a dolgokat! az LLM nyelvi model, semmi koze ehhez, sem az almodozashoz, es kepet sem general (maximum promtolja/utasitja a diffuzios modelt, ahogy az ujabb chatgpt is).
viszont a diffusion modelek, amikkel a kepeket/videokat generaljak (szerintem ez is az lehet) valamikor ebbol fejlodtek ki: