digitalstand.hu wrapper script

Sziasztok!

Érdeklődök, hogy nincs egy wrapper script a tárgyban írt oldalhoz, hogy egy megvásárolt könyvet oldalanként le tudjak kép formátumban menteni, majd PDF-et csinálni belőle? Ahhoz hogy le tudjam szedni, be kell jelentkezni, majd a könyv 2 oldalanként megjelenik, illetve felnagyítható oldalanként, de macerás nézegetni. Torrent oldalon meg nincs fent a könyv.

Üdv:
Laci

Hozzászólások

Nagyon hosszú? Jobb klikk, save as... vagy valami hasonló nem jó?

A wget tud authentikált sessiont kezelni, ha megkapja a megfelelő cookie-kat, csak kérdés, hogy ez segít-e neked. (Nem ismerem az oldalt)

Szerk: megnéztem, ezek valószínűleg nem működnek.

Ha bejelentkezek és megnyitom a megvásárolt könyvet, a böngészőben kb. 600 pixel magasan jelenik meg a dupla oldal, ha meg ránagyítok, akkor lesz kb 1600 pixeles, de már nem látszik egyben az oldal. Egyébként egy 96 oldalas könyv, statikai képletgyűjtemény. A forrását néztem az oldalnak, magában nem jeleníthető meg a kép.

Ha ugyanaz a megjelenítő, ami a napilapoknál, akkor kinyerhető a kép (bár nem valami extra minőség, amikor utoljára használtam, akkor a nem dőlt szöveget azért lehetett OCR-ezni).

Példa: https://digitalstand.hu/olvaso/83639#1

Forrásban ezen az útvonalon haladj: content/pancontainer active/pandiv - sorvezetőként ha viszed felettük az egeret, mindig kap kék kiemelést a kép. Az img tagben lesz egy ilyen: "https://digitalstand.hu/url/c9259c9bef8efc63d21d4d97a3f97652". Ez maga a jpeg, tulajdonsága, hogy nem sokáig érhető el, tehát ezt nem célszerű könyvjelzőzni, egyből menteni kell gépre.

Gyaníthatóan koncepció, hogy ne tudd letölteni a könyveket. :-D

Az ÁSZF-ükbe beleolvastam. Érdekes olvasmány. Egyrészt látszik, hogy egy ideje már bottal sem piszkálták az ÁSZF-et. Másrészt egyértelműen kiderül az általad is jelzett koncepció.

„2.2. Felhasználók a megvásárolt, illetve előfizetett digitális Kiadványokhoz kizárólag a Honlap felületén keresztül jogosultak hozzáférni, azokat csak az 1. számú mellékletben meghatározott új hozzáférési csatornákon tölthetik le, és nem nyomtathatják ki. Ennek megfelelően, ahol a jelen Szabályzat a Kiadványok, illetve Előfizetések megvásárlását említi, az alatt az adott Kiadványhoz vagy Előfizetéshez a Honlap felületén keresztül történő hozzáférést kell érteni.”

Az 1. számú melléklet ezekről szól: „Az iPad applikáció, a Newsstand alkalmazás, és az Android applikáció”

Arról már nem szól az ÁSZF, hogy az „új csatornákon” a 2013 áprilisa előtt vásárolt tartalmak sem érhetőek el. Ezt csak a GYIK-ban említik meg.

Szubjektív véleményem: A Digitalstand szolgáltatás használata az önszopatás kategóriájába esik.

Annyira nem tűnik bonyolultnak, de sima wget kevés lesz ide, kell belépés, token generálás, majd a token segítségével a képek letöltési URL-jének generálása és ezzel a kép letöltése. Persze így ezek sorban egy bash scripttel is megoldhatóak akár.

Gondolom ilyen downthemall meg hasonló letöltésmenedzser browser kiegészítők nem játszanak.

Egyébként azt mondanám, hogy ne wgettel szívasd magad, hanem akkor inkább szívasd magad phantomjs-el. Tutira meg tudja csinálni, ha más nem lementi az egész látható felületet:

var clipRect = page.evaluate(function (selector) {
return document.querySelector(selector).getBoundingClientRect();
}, selector);

page.clipRect = {
top: clipRect.top,
left: clipRect.left,
width: clipRect.width,
height: clipRect.height
};
page.render('image.jpg');

----------------
Bruce Lee

Én simán Chrome alatt megnzétem a Network alatt az anyagot az egyik mintánál: https://digitalstand.hu/olvaso/84871
Alapból a kicsi képet tölti le, de ha ránagyítasz lehúzza a nagyot is, az elemek között meg is tudod nyitni új fülön és ott már a nagy kép jön be.

Erre gondoltam: http://www.kepfeltoltes.eu/images/hdd1/2018/02/16/8032.png látszik, hogy a kép felbontása 1536x2166
Ez lett a letöltött kép: http://www.kepfeltoltes.eu/images/hdd1/2018/02/16/278screencapture_digi…

Kicsit lassú 96 oldalál, de több mint a semmi :)