wget, tükrözés

Linux-kezdő

Tudom, valahol láttam ezt a témát, de nem találom meg a keresőben. Szeretnék lekoppintani egy oldalt, ami a "www.vbsdb.com" nyílt forrású adatbázisával szedi össze a hasznos infókat. Ez az oldal a db.zti.hu. Amint látom, rajta MS webszerver működik. Idáig nincs is probléma. Ha valaki meglátogatja az oldalt, láthatja, hogy 20asával vannak kitéve a rekordok. Átnyálaztam a wget manját, használtam a WebHTTrack-et is, de mindhiába.
Egyetlen, viszonylag működőképes letöltés csak úgy ment, hogy 1-től 20asával 1046-ig (idáig terjed) hozzáadtam a letöltési linkekhez az indexeket, s így lejött az egész, de átláthatatlan.
Amúgy szeretnék belőle egy CD-t készíteni, hogy offline menjen, s ajándék lesz. Kicsit problémásabb volt ez, mikor a mellette lévő "dalok" adatbázist ~6500/20 linkkel szedtem le.

Ha nem is sikerülne (mert a szerver mindig visszadob, bármilyen opciót adok meg), legalább azt tudjam megcsinálni, hogy a már letöltött 1046 db html-ben kicseréljem a sorokat.

No EZT a témát nem találtam sehol. Valaki valamikor összedobott egy olyan scriptet, ahol többszáz fájlban kicserélte az adott sorokat.

Szereték ebben segítséget kérni azoktól az emberektől, akik értenek ilyen script megírásában. Én kikeresném, átnevezném a a html-eket, mert mindegyik egy dalra mutat. 20asával kellene mindig egyel nagyobb értékű linket átcseréltetni.
stb...

Ha valaki tud benne segíteni, nagyon megköszönném, s könnyen tanuló vagyok, később valószínüleg megértem a lépéseket, s tudnék magamon segíteni.

Előre is köszönettel: zolej

1401 megtekintés

szerintem egy wget -r -nH --cut 1 http://db.zti.hu/24ora/dalok.asp-val minden lejon problemamentesen... (legalabbis ugy latszik, persze a veget nem fogom megvarni).

Ha igy csinalod, akkor abba a konyvtarba pakolja, ahol elinditottad a wget-et. Ezutan en a for f in dalok*; do sed -i -e 's|/24ora/||g; s|asp?|asp%3F|g' $f; done parancsal tennem rendbe a dolgot...

Zsiraf

A problema abban volt, hogy a linkek (fel)abszolut hivatkozassal vannak, valamint a '?'-et kell URI-ssa alakitani...

0 szavazat

A hozzászóláshoz be kell jelentkezni

Esetleg a wget -m -np http://db.zti.hu/24ora/dalok.asp nem jó?
Az is leszedi, de még ráadásul a ./db.zti.hu/24ora/ könyvtárba teszi.

0 szavazat

A hozzászóláshoz be kell jelentkezni

Hamarosan ki tudom próbálni. Az a helyzet, hogy -r kapcsolóval próbáltam, az leszedte az 1-20 és a következő oldalról a 21-40-ig, plussz a 1041-1046-ig és ennyi. Az adatbázis elérés + és -1-es "ide-oda" indexelésénél zavarodik meg szerintem.
Nagyjából értem miért csinálja, de ez nekem nem jó :-)

Köszönöm a választ, mindjárt visszajelzek (itt megy a net ezerrel, "2 perc alatt leszedi a csillagokat is")

0 szavazat

A hozzászóláshoz be kell jelentkezni

Sajnos ugyanaz a szitu. Nem megy. Az indexnél itt is két lap után a végére ugrik.
Mivel már megvan az egész anyag, csak egy "pöppet" szétszórva és szét-linkelve, szeretném azon úriember segítségét kérni, aki a scriptelésben segítene nekem.

Elöre is nagyon köszönöm!

0 szavazat

A hozzászóláshoz be kell jelentkezni

ez leszedi az mp3-kat. egy konyvtarba egyenkent, a tobbi file fentmarad.


for i in $(seq 1 5857) ; 
do wget -m --referer="http://db.zti.hu/24ora/dalok.asp" \
  -A mp3  "http://db.zti.hu/24ora/dalok.asp?VBSdbClickClass_1=VBSdbGoToGridRow&VBSdbIndex_1=$i" ;
done

0 szavazat

A hozzászóláshoz be kell jelentkezni

ez leszedi az mp3-kat. egy konyvtarba egyenkent, a tobbi file fentmarad.


for i in $(seq 1 5857) ; 
do wget -m --referer="http://db.zti.hu/24ora/dalok.asp" \
  -A mp3  "http://db.zti.hu/24ora/dalok.asp?VBSdbClickClass_1=VBSdbGoToGridRow&VBSdbIndex_1=$i" ;
done

0 szavazat

A hozzászóláshoz be kell jelentkezni

Friss hozzászólások

Az áfát lehet… 2025-09-15T19:47:50+0200
hányinger vagy 2025-09-15T19:47:29+0200
'Általában'. Vagy nem… 2025-09-15T19:46:31+0200
Csak a hülye gondolhatja,… 2025-09-15T19:45:57+0200
Szerintem így lehet… 2025-09-15T19:44:49+0200
Na, akkor lehet, hogy téged… 2025-09-15T19:42:49+0200
10 millióért vettük a lakást… 2025-09-15T19:40:04+0200
>a 64 bit 64 bites… 2025-09-15T19:37:32+0200
Persze, de bárhol… 2025-09-15T19:36:07+0200
Nem az övé, mer az apja 1… 2025-09-15T19:34:28+0200

wget, tükrözés

Hozzászólások