wget belepiszkál a linkbe - /index.html@

Üdv!

Biztos van rá megoldás, de nekem eddig nem sikerült rájönnöm.

Ez a próba sorom:
================

wget --spider --load-cookies cookies.txt --user-agent="Mozilla/4.0" --execute="robots = off" --no-parent -r -l 1 "https://www.kitaláltoldal.hu/1-harmful-human-activities---videomagyaraz…"

Ezt írja át (vastaggal kiemelve lejjebb):

/?q=1 --> /index.html@q=1

wget --spider --load-cookies cookies.txt --user-agent="Mozilla/4.0" --execute="robots = off" --no-parent -r -l 1 "
https://www.kitaláltoldal.hu/1-harmful-human-activities---videomagyaraz…"
--18:59:23-- https://www.kitaláltoldal.hu/1-harmful-human-activities---videomagyaraz…
=> `www.kitaláltoldal.hu/1-harmful-human-activities---videomagyarazat/index.html@q=1-harmful-human-activities---videomagyarazat%2F&csid=4&fid=7'

Így viszont nem létezik a link.
Mit nem vettem észre?

Update: A link megváltoztatását megoldotta a --default-page="" kapcsoló.

Az oldalban található videót meg azért nem szedi le, mert nem href-ben van a link, hanem < source src="blabla"> tag közé van zárva.

Lehet ezt tudatni a wgettel?

Hozzászólások

--default-page=[index.html]

----------------
symbolweb.hu

Köszi! Ha ezt így beírom, akkor ezt eredményezi:

videomagyarazat/[index.html]@q=1

Kipróbáltam a --default-page="" ezzel már lejön legalább az oldal html formában, de a benne lévő relativ video hivatkozást nem követi.
Igy néz ki a forrásban:

< source src="ftp/mp4/kozep3/human.mp4" type="video/mp4">

Közben beletettem a "--follow-ftp -L"-t is a parancsba.

Most azt kell kitalálnom miért nem követi a linket.

Az oldalról a videót jobbklikkel le tudom menteni.

Az oldal URL így nézki:
https://www.blablabla.hu/1-harmful-human-activities---videomagyarazat/?…

A wget az alábbi folder struktúrába menti le:

D:\wget\www.blablabla.hu\1-harmful-human-activities---videomagyarazat
D:\wget\www.blablabla.hu\1-harmful-human-activities---videomagyarazat\@csid=4&fid=7
D:\wget\www.blablabla.hu\1-harmful-human-activities---videomagyarazat\@q=1-harmful-human-activities---videomagyarazat%2F&csid=4&fid=7

Az utolsó két sor 1-1 kiterjesztás nélküli html fájl.

Ez a wget sor pedig simán leszedi a videó fájlt.
https://www.blablabla.hu/ftp/mp4/kozep3/1harmfulhuman.mp4

A referrer részt ellenörzést nem tudom hogyan tudnám megnézni.

Köszi!

Ha a wget direktben leszedi, akkor nincs referrer ellenőrzés.

Marad az URL megfelelőség problémája. A kiterjesztés nélküli HTML fájlok mit tartalmaznak/mekkora méretük? Lehet, hogy abban van benne a RAW adat (mp4 forrás) vagy legalább egy hibaüzenet, hogy miért nem szolgálta ki a szerver.