Udv!
Egy eleg komplikalt problemaval allok szemben amire nem talalom a megfelelo megoldast.
A problema alapjaban:
A cel egy weboldal letoltese percenkent, ami szep es egyszeru lenne wget-el. Ott kezdodnek a gondok, hogy az oldal elerese bejelentezest igenyel.
Jelenlegi megoldas:
Most egy eleg buta, de mukodo modszer van hasznalatban: Az oldalt behozom valami grafikus bongeszoben pl chrome, ott bejelentkezek aztan futtatok egy bonyolult scriptet percenkent amiben van wmctrl, xdotool stb. a lenyeg hogy a kepernyorol vagolapra helyezem az oldal tartalmat amit kiolvasok xclip-el ezt fajlba irom es elkezdek vele dolgozni egy c programmal. Innen latszik, hogy ezt hosszu tavon nem igazan lehet mukodtetni, foleg mivel kell neki az X.
Aztan eljutottam oda, hogy w3m-el is le tudom tolteni az oldal tartalmat, sokkal egyszerubben:
-w3m-el belepek
-betoltom egyszer az oldalt
-shift+s -> beirom a fajl nevet es mar lent is van
-varok 60 sec-et
-shift+r
-shift+s
-fajlnev beir
-varok 60 sec-et
...
ami santit, az az hogy amig X alatt egyszeruen csinalsz bill leuteseket xdotool-al addig ez nem olyan egyszeru console-on, konkretan barhol kerestem nem talaltam.
A kerdes tehat a kovetkezo:
-Hogyan toltesz le egy oldalt percenkent amihez bejelentkezes kell? (ha csak oldal forrast kapsz, az is jo, onnan kiszedem a lenyeges adatot).
Hozzászólások
Udv,
egyreszt nemelyik honlapon mukodhet a wget is, nezz utana a " --save-cookies cookiejar --keep-session-cookies --post-data " kapcsoloknak.
Masreszt ilyesmikhez en a 'mechanize' Python modult szoktam hasznalni, itt egy rovid pelda loginhoz:
http://ubuntuincident.wordpress.com/2011/11/08/download-login-protected…
Ha a kérdéses oldal használ cookie-t a munkamenet azonosításhoz akkor megpróbálhatod a curl használatát.
(http://hu.wikipedia.org/wiki/CURL)
Böngészővel csináld végig a bejelentkezési folyamatot majd a kapott cookie-t felhasználva a curl segítségével automatizálhatod az adatok letöltését.
Koszi!
Igen, ugy nez ki, ez jo lesz.
---
Where there is a shell, there is a way.
... és a módszer gond nélkül működik wgettel is:
wget --load-cookies grafbongeszobolkinyertsutik.txt