googlebot gyilkolja a rendszerem

Fórumok

Sziasztok!

Kernek ismet egy kis segitseget, mivel a googlebot bas*tatja a rendszerem eleg rendesen. Tobb gigas apache access fajlok keletkeznek mivel ez a szar szkennel (http://www.google.com/bot.html)

Tudtok valami trukkot, hogy apache-ban hogy tudom kezelni ezt a hibat?

koszonom

Hozzászólások

addig google-zok, mert mar talaltam valami robot.txt-s huleseget....

Tuti, hogy ki akarod tiltani? Ha nem térképezi fel a honlapodat, akkor sehol se leszel a találati listában. Más. Biztos, hogy a gogglebot generálja a több gigás logot?

Ha a gyilkolja dolgot úgy érted, hogy túlzott mértékben terheli, akkor tegyél be robots.txt végére egy "Crawl-delay: 5" sort(idézőjelek nélkül). A szám másodpercben megadja, hogy mennyi időnként küldhet új kérést.

Beregelsz a webmaster toolsba és megmondod neki, hogy lassítson.

Egyrészt robots.txt irányában indulj el, másrészt nekünk volt még olyan problémánk, hogy baromira összetett kereséseket indított (15-20 paraméterrel), ami miatt a xapian iszonyatosan belassult, cpu load egekben... Ugyanez xapian nélkül tuti db halált okozott volna. Rewrite rule és user agent alapján request ellenőrzése
--
Kis problémából egy kis munkával nagy problémát lehet gyártani. Ha valami müxik ne b***tasd :)
Uriember az, aki nem beszél a Windows-ról, pedig tudna...