GPT-5 szakmai review

Hozzászólások

ez egy butaság, nem szakmai review. 

az llm nem numerikus számítások elvégézésre való, akár meg tudná helyesen csinálni, akár nem tudja 

használni tud viszont külső toolokat a kapott, és maga által lépésekre lebontott matematikai feladat lépései elvégzésénél. Például a promptban előírod hogy a megfelelő wolfram api-t vegye igénybe a számításokhoz. Így bonyolult, sok lépéses számítási feladatot is el tud végezni

Elolvastam az introducing gtp-5 weboldalt az openai portálján, az ott írtak alapján mondd neki a promptban, hogy think hard about this vagy hasonló értelműt, és akkor jó eredményt ad biztos, mert akkor a reasoning modellhez küldi a promptot ( One unified system című fejezetben írja). Reasoning vs nem-reasoning feladat, inkább a chat felület mögötti prompt routerről szól ez "hiba" nem a modellről. Ez nem szakmai review, hanem trollkodás. 

Ez nagyon jó, csak az egyik fő újdonság az volt, hogy a sok különféle model helyett lesz egy router, ami a megfelelő modellt és toolt használja egy adott feladathoz. 

Ha neki egy egyenlet és a "solve" utasítás nem elég ahhoz, hogy thinking modellt használjon, akkor az egy rakás szar, minek egyetlen értelme van, mégpedig az, hogy csökkentse az OpenAI működési költségeit. 

Még maga az OpenAI is sok dologban visszakozott a bejelentés óta (lásd például a sokszor átírt bejelentést is), de nyugodtan kitarthatsz ennek ellenére amellett, hogy én vagyok a troll. 

Mindeközben máshol:

Grok, non-thinking modell: https://grok.com/share/bGVnYWN5_5e423545-6e1a-48df-9d1a-191bbc5e8557 

szerk: raadasul bonyolultabb dolog ez, mint bedogni neki, hogy "think harder", nem tudom, honnan vetted, hogy ez megbizhatoan mukodik

The decision to “think longer” uses signals from your prompt and conversation, as well as learned patterns from how people manually choose models, their preferences, and how often the model’s answers are correct.

Na, hat rajtam ne muljon, mondom akkor szajbaragosan.

A megjelenes elotti hetekben csucsra volt porgetve a hype gepezet, aminek kb. az volt a lenyege, hogy a GPT-5 mindenkit megbasz majd, es ez mar majdnem AGI, meg mittudomen. Sama mar halalcsillagokat posztolt, illetve az ismertebb OAI employee-k is durrogtattak rendesen a meme-eket.

Ehhez kepest ez egy consolidation release volt, amivel nem lenne baj (lasd 4–>4o), csak nem ez volt az igeret. Helyette mit kaptunk:

  • csusztatasokat a bejelentesben
  • hasznalhatatlan autoswitchert (lasd a linket az OP-ban)
  • ertelmezhetetlen portfoliot (pl. GPT-5 with Thinking vs GPT-5-Thinking)
  • figyelmeztetes nelkul deprecatedde valt modelleket
  • csokkentett usage limitet (lasd Plus - heti 2900 thinking request helyett 200)
  • egy minden szempontbol kozepszeru "flagship" modellt

De legalabb az appban a color pickerben havi 200 dollarert beallithatod a fekete UI-t is, yay!

A GPT-5 mögötti ígéret az volt, hogy az embert meghaladó intelligencia lesz - mindent is jobban fog tudni és feleslegessé teszi a fehérgallérosok elsöprő többségét. Ehhez képest:
 

Artificial Analysis

Ha tartós rendszert építesz és okos csapatot nevelsz, akkor száz kiadásban sem érheti baj; ha csak a gépekre hagyatkozol, akkor egyszer jól jársz, máskor rosszul; de ha sem a rendszer nem bírja a terhet, sem a csapat nem tanul a hibákból, akkor minden egyes kiadás kockázat.

Vagyis az történik az ChatGPT-vel, ami már a megjelenésekor várható volt, kiderül, róla, hogy ez is egy tool, ami bizonyos fokig használható bizonyos feladatok gyorsabb elvégzésére, kiváltképp, ha valaki hajlandó megtanulni a használatát, de emberi szakértelem és szorgalmas munka nélkül semmit sem lehet vele előállítani, amit hosszútávon el is lehet adni a piacon. 

Jó kis eszköz ez, de ennél lényegesen többet tudni nem fog - legalábbis a tömegeknek szánt kereskedelmi változatok. 

Ha tartós rendszert építesz és okos csapatot nevelsz, akkor száz kiadásban sem érheti baj; ha csak a gépekre hagyatkozol, akkor egyszer jól jársz, máskor rosszul; de ha sem a rendszer nem bírja a terhet, sem a csapat nem tanul a hibákból, akkor minden egyes kiadás kockázat.

Vagy inkább milyen ígéretekkel csábították oda azt a rengeteg befeketetői pénzt. Nemrég egy szolgáltatónál valamelyik ChatGPT4-es modellel hajtott AI  service deskjénél nyitottam jegyet és kaptam "AI asszisztált segítséget" - olyan is volt. Szerencsére még alkalmaznak embereket is, így megoldódott a problémám.

Ha tartós rendszert építesz és okos csapatot nevelsz, akkor száz kiadásban sem érheti baj; ha csak a gépekre hagyatkozol, akkor egyszer jól jársz, máskor rosszul; de ha sem a rendszer nem bírja a terhet, sem a csapat nem tanul a hibákból, akkor minden egyes kiadás kockázat.

Lehet, hogy ez mar annyira okos lett, hogy emiatt automatikusan neurodivergensse (autistava) valt. :D