Tömeges node felvitel Drupalba

Sziasztok!

Van egy olyan oldal, ahol nagyon kusza az adatbázisszerkezet és a tartalom egy részét az összetákolt CMS a fájlrendszerből veszi. Node_import-hoz csak nagyon sok munkával tudnám importálhatóvá tenni a tartalmat. Ezért gondoltam, hogy hagyom az egészet és megpróbálom valahogy a honlapról leszedni az információkat. Találtam is egy Firefox kiegészítőt, az iMacros nevűt, de nem az igazi. Javaslatokat várok, hogy mit lenne érdemes használni helyette.

Köszönöm a segítséget.

Hozzászólások

Bocs lehet, hogy csak én nem értem, de most exportálni vagy importálni szeretnél? Vagy van egy meglévő rendszer amiből az adatokat át szeretnéd tenni Drupal alá?

Meglévő rendszer alól szeretném az adatokat átrakni Drupal alá. A meglévő rendszer egy "egyedi" CMS, amiben csak azért nincs goto, mert PHP-ban olyan parancs nincs.

Bár most nézem, hogy a generált site sem működik rendesen, ott is összevisszaság van, de azért szerintem egy jól megírt makróval ki lehet menteni nagy részét.

Bocs, ha félreérthetően fogalmaztam.

szerk: The goto operator is available as of PHP 5.3. ... még jó, hogy a CMS 8 éves.

Hát mivel meglehetősen speciális esetről van szó (egyedi CMS) szerintem készen nem találsz rá megoldást. Egy kicsit többet is elárulhatnál a dologról, mert így nehéz bármit is mondani. Pl. adatbázisból-adatbázisba nem mozgathatóak az adatok? A fájlrendszerből milyen adatokat vesz? (képek, html, script, ...) Köztes megoldás nem működik, pl. drupal modul írása, ...

Adatbázisból adatbázisba megoldható, kb 1 hetes verítékes munkával, de azt nem fogják megfizetni.

Alap tartalmakat az egyedi CMS is adatbázisból vesz, de néha fájlrendszerből elég érthetetlen módon. Pl FTP-n(!) feltöltik a képet, majd melléraknak egy kepneve.jpg.inc fájlt, amiben a képaláírás van, aztán a képeket tartalmazó mappába egy leiras.inc-t, amiben a galéria bevezetője található, néha megspékelve némi PHP kóddal. Mindez az adatbázissal olyan kapcsolatban áll, hogy a galériák listája adatbázistábla tartalmazza a képgaléria könyvtárának a nevét. Aztán ott vannak az egymásba ágyazott tartalmak, amiknek az include fájljai PHP-t is tartalmaznak.

Tele van ilyen furcsaságokkal az egész, viszont a generált oldal viszonylag egységes. Most azon töröm a fejem, hogy egy egyszerű shell scripttel leszedem az egész weboldalt, regex-el kivágom, ami nekem kell, kiírom fájlba, amit Drupal node_import moduljával importálhatok. Az iMacros is erre kellett, csak gondoltam, van erre valami jó grafikus megoldás. Igazából van, de mind windowsos és fizetős. A windows miattam, a fizetős rész pedig a munka miatt nem jöhet szóba.

Amikor ilyenre volt szükségem, akkor írtam egy kis PHP cuccot, ami behívta a Drupal bootstrap-ot, majd a régi oldalról kinyerve az adatokat összeállított egy $node objektumot, és mehet is a node_save().
Ha sok tartalom van, és nem akarsz a batch api -val szórakozni, akkor érdemes lehet a saját gépeden elvégezni ezt, ahol kellően magasra (végtelenre?) tudod tenni a PHP max_execution_time értékét.

-----
"Egy jó kapcsolatban a társunkat az ő dolgában kell támogatni, nem a miénkben."

Nagyon örülök ennek a témának. Én egy összetákolt, nem frissített drupalból szeretném átmenteni az adatokat egy új stabil drupalba. Milyen úton érdemes elindulni?

Írtam h összetákolt. Egy agyonhaxolt viszonylag nagy oldalról van szó. Közel 500MB méretű az adatbázisa, rengeteg rekorddal. Az a fő bajom h nem rendeltetésszerűen lett feltöltve a tartalom sem, volt amit utólag kézzel raktak be adatbázisba. Így exportra nem szed le mindent, upgradre meg becrashel. Attól félek valami egyedi script, vagy még rosszabb egyesével kéne kivadászni a tartalmat. Az ilyen fejlesztőnek hívott valaminek törjenek le az ujjai, aki ilyet gányol össze. Feltelepít egy drupalt és ő a nagy webguru. Ha valaki meg átveszi, az meg rokkanjon bele. Cégnevet nem írok, de sztem nem ez az egyetlen ilyen..