Ritkán szükségem van arra, hogy valamiféle információt legyűjtsek egy weboldalról. Jellemzően táblázatba akarom látni a végeredményt.
Olyasmit képzeljetek el, hogy pl. van egy webshop, és egy árlistát szeretnék készíteni. Végig akarok menni az oldalon, és minden termék minden változatát a táblázatomba be akarom tenni, pár extra adattal, pl. ár, termékkód, ilyesmik (ezek mind ott vannak az oldalakon, és kézzel simán kigyűjthető, csak hetekig tart).
Vagy van egy kiállítás, és én a kiállítás weboldalán végig akarok menni a kiállítók listája menüpont alatt található több száz oldalon, és a táblázatomba be akarom tenni, hogy mi a kiállító neve, a kiállításon melyik standon vannak, és esetleg hasonló, az oldalon megtalálható adatok).
Próbáltam ChatGPT-t használni erre, és ugyan azt állította, hogy meg tudja csinálni (csak kell rá 5 nap), hozzá se kezd. Azt mondja, hogy majd szól, ha kész. Ha bármikor rákérdezek (pl. letelt az 5 nap), hogy hogyan halad, azt mondja, hogy ja, hát nem tudom megcsinálni, mert ez meg az. És akarom-e, hogy mondjuk az eredeti kérés valamennyire egyszerűsített változatát csinálja meg először? Amit aztán ugyanúgy nem is kezd el.
Legutóbb, amikor a kiállítók listáját kértem tőle, azt mondta, hogy ez túl nehéz (miután kétszer bekamuzta, hogy csak várjak, és majd ad valamit), de ha én odaadom neki a kategóriánként kigyűjtött kiállítók listáját, akkor ő ezeket isten bizony össze tudja fűzni egy listába. Persze ha már megvan a kategóriánkénti lista, kb. 15 csv fájlban, akkor azt én is össze tudom fűzni. Pl. a cat paranccsal.
Szóval vagy azt szeretném megtudni, hogy hogyan tudom a ChatGPT-t rávenni erre, hogy tényleg csináljon is valamit, vagy mi mást tudnék használni erre?
Az nem zavar, ha esetleg napokig szöszmötöl (bár jó lenne, ha nem lenne mondjuk pár óránál hosszabb a feldolgozás), csak szeretném, hogy legyen használható eredménye a várakozásnak.
- 93 megtekintés
Hozzászólások
Próbáltam ChatGPT-t használni erre, és ugyan azt állította, hogy meg tudja csinálni (csak kell rá 5 nap), hozzá se kezd
Ez agent módban? Vagy milyen 5 nap?
Ha elküldöd, hogy mi kell pontosan, megfuttatom neked agentként, hátha. (Agent, ebben a kontextusban = van saját desktopja, browserje GUI-val, Pythonja, stb.)
szerk: meg ha nem titkos, egy conversation URL-t dobjál már, nagyon furcsa nekem ez, hogy chat módban várakozni kell. Néha hallucinál olyat, hogy van mondjuk egy queue ilyen taszkoknak, de nincs. Ami a response-ban van, az a teljes response.
- A hozzászóláshoz be kell jelentkezni
Ez engem is érdekelne. Nekem egy barátom, aki mindenféle AI-ra és azon alapuló szolgáltatásokra fizetett elő, megpróbált például hirdetési újságokban egy bizonyos témájú hirdetéseket kikeresni. Nemcsak, hogy nem csinálta meg nekik az AI, de kimondottan felhasználói szabályzatba ütközőnek minősítette, mivel nem használhatsz AI-t adatbázisépítésre.
Ez akkor nem igaz? Van olyan AI eszköz, amivel tartalmakat gyűjthetsz ki egyes weboldalakról legálisan?
- A hozzászóláshoz be kell jelentkezni
"...van egy webshop, és egy árlistát szeretnék készíteni. Végig akarok menni az oldalon, és minden termék minden változatát a táblázatomba be akarom tenni, pár extra adattal, pl. ár, termékkód, ilyesmik "
Szerintem a webáruházak jelentős része igyekszik kizárni az ilyesmi robotokat, amelyek adatot gyűjtenek. Ezt többnyire a konkurens cégek csinálják egymással, hogy a vetélytársak árait elemzik.
Vagy kérd el az árlistát táblázatban, vagy keress rá, hátha ott van letölthetően is.
- A hozzászóláshoz be kell jelentkezni
Ez egy elég determinisztikus html letöltés és feldolgozás feladat, generatív modellt inkább a crawler program előállítására használnék csak, nem a feladat elvégzésére. Ha viszonylag szépen megfogalmazod a programozási feladatot, nem tudom, hogy a chatgpt megcsinálja-e megfelelő minőségben, de az anthropic opus ilyen összetettségű python, ts, java stb nyelvű programot egészen biztosan gyorsan elő tud állítani. Pythont biztosan. A futtatás mehet localhoston, vagy bérelt kapacitáson, amíg a bolt ki nem dob.
- A hozzászóláshoz be kell jelentkezni