Üdv!
Biztos van rá megoldás, de nekem eddig nem sikerült rájönnöm.
Ez a próba sorom:
================
wget --spider --load-cookies cookies.txt --user-agent="Mozilla/4.0" --execute="robots = off" --no-parent -r -l 1 "https://www.kitaláltoldal.hu/1-harmful-human-activities---videomagyaraz…"
Ezt írja át (vastaggal kiemelve lejjebb):
/?q=1 --> /index.html@q=1
wget --spider --load-cookies cookies.txt --user-agent="Mozilla/4.0" --execute="robots = off" --no-parent -r -l 1 "
https://www.kitaláltoldal.hu/1-harmful-human-activities---videomagyaraz…"
--18:59:23-- https://www.kitaláltoldal.hu/1-harmful-human-activities---videomagyaraz…
=> `www.kitaláltoldal.hu/1-harmful-human-activities---videomagyarazat/index.html@q=1-harmful-human-activities---videomagyarazat%2F&csid=4&fid=7'
Így viszont nem létezik a link.
Mit nem vettem észre?
Update: A link megváltoztatását megoldotta a --default-page="" kapcsoló.
Az oldalban található videót meg azért nem szedi le, mert nem href-ben van a link, hanem < source src="blabla"> tag közé van zárva.
Lehet ezt tudatni a wgettel?
- 1226 megtekintés
Hozzászólások
--default-page=[index.html]
----------------
symbolweb.hu
- A hozzászóláshoz be kell jelentkezni
Köszi! Ha ezt így beírom, akkor ezt eredményezi:
videomagyarazat/[index.html]@q=1
Kipróbáltam a --default-page="" ezzel már lejön legalább az oldal html formában, de a benne lévő relativ video hivatkozást nem követi.
Igy néz ki a forrásban:
< source src="ftp/mp4/kozep3/human.mp4" type="video/mp4">
Közben beletettem a "--follow-ftp -L"-t is a parancsba.
Most azt kell kitalálnom miért nem követi a linket.
- A hozzászóláshoz be kell jelentkezni
Igen a paramétert üresen kell használni. :)
Relatív útvonalról mit csinál? Miként hívja meg? Lehet hogy jól hívja csak a videókat védik a refferer ellenőrzésével?
- A hozzászóláshoz be kell jelentkezni
Az oldalról a videót jobbklikkel le tudom menteni.
Az oldal URL így nézki:
https://www.blablabla.hu/1-harmful-human-activities---videomagyarazat/?…
A wget az alábbi folder struktúrába menti le:
D:\wget\www.blablabla.hu\1-harmful-human-activities---videomagyarazat
D:\wget\www.blablabla.hu\1-harmful-human-activities---videomagyarazat\@csid=4&fid=7
D:\wget\www.blablabla.hu\1-harmful-human-activities---videomagyarazat\@q=1-harmful-human-activities---videomagyarazat%2F&csid=4&fid=7
Az utolsó két sor 1-1 kiterjesztás nélküli html fájl.
Ez a wget sor pedig simán leszedi a videó fájlt.
https://www.blablabla.hu/ftp/mp4/kozep3/1harmfulhuman.mp4
A referrer részt ellenörzést nem tudom hogyan tudnám megnézni.
Köszi!
- A hozzászóláshoz be kell jelentkezni
Ha a wget direktben leszedi, akkor nincs referrer ellenőrzés.
Marad az URL megfelelőség problémája. A kiterjesztés nélküli HTML fájlok mit tartalmaznak/mekkora méretük? Lehet, hogy abban van benne a RAW adat (mp4 forrás) vagy legalább egy hibaüzenet, hogy miért nem szolgálta ki a szerver.
- A hozzászóláshoz be kell jelentkezni
Küldtem privátot a nyers forrásról.
köszi.
- A hozzászóláshoz be kell jelentkezni