sitemap - érsz-e valamit nekem?

Az ember lépten-nyomon belebotlik a SEO-ba. Jelentése: Search Engine Optimization, azaz keresőmotor optimizálás. Huh, komoly. Beírja polgár óvatlanul a keresőbe, hogy "bikmakk" és erre minimum tíz SEO-így, SEO-úgy oldal jön fel. Akarva-akaratlanul belenéz, hogy wtf? Ebből kifolyólag, nomeg a Google Webmaster Tools állandó sipárgása miatt úgy döntöttem, hogy készítek a HUP-hoz is egy sitemap-ot "úgyse árthat" alapon.

A sitemap vagy más néven webhelytérkép a keresőrobotok keze alá dolgozó, meghatározott formátumú file. Benne az oldal fontosabb URL-jei találhatók. A keresőrobotok a sitemap-ot időközönként benyalják, összehasonlítják a saját indexükkel, aztán ha van differencia a sitemap javára, akkor azt vagy figyelembe veszik, vagy nem. De tényleg. Azt mondja:

Using the Sitemap protocol does not guarantee that web pages are included in search engines, but provides hints for web crawlers to do a better job of crawling your site.

Oké, legyen sitemap. Tesztként generáltam egy sitemap-ot a HUP-hoz cirka 30 000 URL-lel (egy file-ban 50 000 lehet a maximum, a file mérete nem haladhatja meg a 10MB-ot). Kíváncsi vagyok, hogy mit ér.

Bedobtam a Google-nek:

Google Webmaster Tools - webhelytérkép

Azt mondja, hogy 30 150 URL-t adtam neki. Ebből 17 545 van az indexében. Jó munkát! :) Sajnos azt a keresők nem garantálják, hogy annyi oldalt be is indexelnek, amennyi a sitemap.xml(.gz)-ben található...

Azért biztos ami biztos, beadtam a Yahoo!-nak is:

Yahoo! Site Explorer - webhelytérkép

És ha már SEO, legyen kövér alapon a Live Search-nek is :)

Microsoft Live Search - webhelytérkép

Valószínűsítem, hogy a sitemap-nak inkább olyan oldalaknál van jelentősége, amelyek indulófélben vannak, vagy nagyon kacifántos (nem böngészőbarát) url-eket használnak. De mindegy, a keresőknél fontos, hogy jól feküdjön az ember oldala. Ha ártani nem árt, akkor legyen. Sokból nem állt megcsinálni. Frissíteni nem fogom gyakran (automatizálni, meg botot pingelni meg pláne nem), mert ahogy nézem, az új HUP cikkekre a Google néhány másodperc alatt úgy csap le, mint a vércse...

Ennyit a SEO-ról. Egyelőre.

Megjegyzés: szerintem a "legjobb SEO", ha jó tartalmat teszel az oldaladra. A keresők előbb-utóbb úgyis indexelni fogják.

Hozzászólások

Es mar kint is van googlen ez a post, 4 perce. :)

Igen, tudtam, hogy van. Nekem teljesen megfelelt hozzá a Google python scriptje, egy kis grep, meg sed :) Ha valaki pedig nem akar ezzel szórakozni (konfigurálgatni), akkor itt egy Java WebStart alkalmazás: sitemapGenerator

Teljesen jól használható.

Ezeknél a 3rd party Drupal moduloknál mindig az első, hogy megnézem a Bug oldalukat és el szoktam borzadni, hogy egy csont egyszerű feladatot ellátó modulban miért van ennyi bug. Nem bízom a 3rd party modulokban. Hacsak tehetem, kerülöm őket.

--
trey @ gépház

fogadjunk, hogy azert csap le a google olyan gyorsan, mert mevette a feedburnert, es te feedburnerrel szolgaltatsz RSS-t. ha mar amugy is azonnal kell neki, akkor elteszi minden indexebe.

--
Live free, or I f'ing kill you.

A főoldali cikkenél igen, lehetséges. Korábban már én is felvetettem ezt itt egy hasonló témában. Azonban a blogok nincsenek átnyomva a Feedburner-be, s mégis alig kell pár perc. Szerintem már ideszoktak enni a botok :) Valószínűleg egy olyan oldalon, ahol óránkénti frissítést kapnak, azt gyakrabban kotorják, mint amit naponta, vagy sok naponta frissítenek csak.

--
trey @ gépház

Ennel azert bonyolultabb a keplet. A HUP hosszu evek ota megbizhato es jo tartalmat szolgaltat (99% szoveg, alig-alig kep), nincs rajta semmi olyan, ami miatt ne sorolnak jo helyre a robotok (pl. lama SEO trukkok), ellenben nagyon sokan linkelik, koztuk ranking szemponbol fontos oldalak is.

Azt hiszem, nem lovok nagyon melle, de szerintem semmit sem er HUP eseten a sitemap.
Nagyon regi, keresobarat, rendszeresen frissulo oldal, gyakran indexeli mar igy is.

Egy otlet (nemtom kulon Drupal modulkent vagy Apache logbol celszerubb-e megvalositani):
meg lehetne oldani, hogy olvasokent lassuk, mikor jarta be utoljara a Google az adott aloldalt?
User-agent alapjan (plusz ugye IP) meg lehet allapitani, es erdekes is lenne.

Valahol amugy azt olvastam, hogy a gyakran frissulo oldalakat nem csak gyakrabban bejarja, hanem jobb helyre sorolja, mint azt, amivel nem torodnek. Szoval ha valaki idonkent frissiti az oldalat nagyobb tartalommal, az jobban jar, ha idozitve jelentet meg kesobb bizonyos tartalmakat (ez nyilvan nem friss hirre vonatkozik, hanem blogra, hosszabb fejlesztesre).
----
400 MHz CPU, 64MiB RAM, 2GiB Flash, 480x640
honlap készítés

Ha már ennyire benne vagy az optimalizálásba, nem lehetne megoldani,h ogy az online felhasználók blokk ne jelenjen meg a keresők számára? Elég zavaró tud lenni, ha akarok keresni valamit, tudom, hogy egy hozzászólásban volt és még azt is, hogy kik írtak arrafele és az online felhasználók blokk miatt bedob egy csomó fals találatot is.