Blogspot.com blogok mentése

 ( Miles | 2013. július 9., kedd - 22:27 )

Sziasztok!

Kezelek egy alapítvány számára több blogot a blogspoton. Azt a feladatot kaptam, hogy rendszeresen mentsem le a tartalmakat. Nem jó a beépített xml-be mentés. A teljes oldalakat mirrorozni kéne (összes bejegyzés +hozzászólás és nem csak a szöveg hanem az esetleg csatolt képek is kellenek). Próbálkoztam wgettel meg httrack-el, de mindegyik elhasal. A gond az, hogy mindegyik oldal zárt és csak a megadott felhasználók tudják olvasni, az említett eszközök meg úgy tűnik nem tudnak mit kezdeni a Google autentikációjával.

Van-e valamilyen megoldás erre a problémára?

Hozzászólás megjelenítési lehetőségek

A választott hozzászólás megjelenítési mód a „Beállítás” gombbal rögzíthető.

Valószínüleg ezt is meg lehet oldani curl-al és különbözö post paraméterek/értékek elküldésével.
Kezdésnek jó lehet valami böngészö plugin amivel a post adatokat tudod olvasni.
Ki mit küld el, melyik szervernek, milyen url-nek, stb...
Ezeket utána elvileg össze tudod rakni a curl-al is. Azaz képes vagy elvileg úgy küldeni, fogadni az adatokat curl-al, mintha az egy "normális böngészö" lenne.
Így nem kis munka árán elvileg be fogsz tudni lépni oda ahova kell, ha csak ez a baj, hogy lementsd a tartalmát a blogspot-os oldalaknak...
Bár lehet van jobb tool is hozzá.

Lehet az én logikám rossz már ilyen késön, de nem statikus lapokat fogsz kapni ha lemented a blogspot-os tartalmat? Azzal késöbb mit tudsz kezdeni, ha vissza kell állítani?
Szerintem ha már blogspot-ra kerültek a blogok, akkor sajnos meg kell elégedni annak a szolgáltatásnak a mentési lehetőségeivel.
Ha ez nem tetszik annak aki a mentést kérte, akkor lehet saját hosztingba és saját blog motorra (wordpres, drupal, joomla, stb... tetszés szerint) építeni a blogokat. Saját rendszer esetén az egész adatbázis és kód menthető, amivel nagyobb esélye, hogy vissza lehet úgy állítani és azt és akkor amikor azt valaki szeretné.

Bár biztos jönnek majd az okosok, és mondanak okosabbat :)

Ez a curl-os dolog elvileg működhet. Valahol találtam egy GOC projectet ami ezt tudta volna. Csak sajna jó néhány éves a kód és már nem működik (ha jól értem azóta változott a google autentikációs eljárása - bár ezt lehet, hogy félreértem). És ráadásul a curl-hoz teljesen hülye vagyok.

A statikus letöltés teljesen jó. Az a lényeg, hogy egyben meglegyen minden szöveges tartalom a beillesztett képekkel együtt.

Hirtelen találtam, hátha...
http://www.shoutmeloud.com/back-up-your-blogger-site.html

Van valami online is, de gondolom abban nem bíznál te sem.
https://blogbackupr.com/

A Bloggerbackupot próbáltam. Régi darab, már nem fejlesztik és a privát blogokon ez is fennakad.

On-line-t meg valóban nem szeretnék.

Valószínűleg van - ha a blogspot sütiket használ a sessiontároláshoz.
Hasonló oldalakon töltögettem már wgettel (olykor + némi html parszolással): bejelentkeztem ffoxon keresztül, lementettem a sütiket a $COOKIES fájlba.

Aztán

wget $egyebszuksegeswgetkapcsoloim --load-cookies "$COOKIES" $urleim

Kipróbáltam. Bejelentkeztem a Google-ba, lementettem a sütiket egy fájlba. Aztán megadtam a wget-nek, de csak egy oldalt szed le amiben kéri a Google, hogy jelentkezzek be.

A httrack hol hasal el?