( DieHappy | 2024. 05. 09., cs – 10:38 )

A problema valos, nem toled hallom eloszor, de van par megoldas. Az egyik, ha letezik AGI, aki valodi kornyezetbol sajat adatkat szerez. Itt meg nem tartunk (allitolag), szoval a kevetkezo legiobb dolog a human feedback. A midjourney is tobb kepet general, abbol valasztja ki a user a neki tetszot. Ezzel uj tanitasi adatot ad, megha nem is sokat. A chat alapu rendszerek is kapnak visszajelzest, a beszelgetesek analizisebol lehet latni, mennyire elegedettek a tartalommal. A tozsden evek ota alkamaznak gepi tanulasi algoritmusokat, ott altalaban a profit es a fenntarthato profit a kulcs, de gyakorlatilag egymas ellen versengenek. Az emberi intuicio ott nem sokat segit.

A szimulalt kornyezetek is hasznosak, es ebbol nem csak fizikai lehet. C++-t is lehet tanulni, csak a hibauzenetekbol. Altalaban viszont van rengeteg szoftvert, amit emberek hasznalnak valos kornyezetben, igy nagyon sok szakertelmet surit. Azon mind hasznalhatoak szimulalt kornyezethez.

Az OpenAI allitolag onnan szerzett uj adatokat, hogy youtube videok hangsavjait irta at szovegge. Hogy miert epp a llama3 a facebooktol a mostani egyik legjobb modell, a grok az X-tol, nekem azt jelenti ok talaltak uj forrast. (Emlekezetes, hogy a twitter megvasarlasakor Musk mennyit ugralt a twitteren levo botok aranyarol).

A problema persze nincs vegleg megoldva, de egy ideje mar vannak valo eletben hasznalt rendszerek, amiknek az eredmenyeit lehet ertekelni.