Bemutatkozik a HTTP Archive

Már több mint egy évtizeddel ezelőtt volt, aki úgy érezte, hogy az internetnek kulturális jelentősége van, ezért valamilyen módon meg kellene őrizni a tartalmát az utókor számára. Ezen elgondolás mentén indította útjára 1996-ban Brewster Kahle az Internet Archive-ot és a The Wayback Machine-t, amely visszamenőleg tárolja az Interneten elérhető oldalak tartalmát.

Steve Souders úgy gondolja, hogy nem csak a weboldalak tartalmát kellene archiválni, hanem azt is, hogy ezek a tartalmak milyen módon vannak strukturálva, kiszolgálva.

Hogy ezek az információk is fennmaradjanak, útjára indult a HTTP Archive kezdeményezés. A HTTP Archive egy olyan tároló, amely rögzíti a webes tartalmak információit. Ilyen információk például a weblapok mérete, az alkalmazott technológiák, a legtöbb Javascript-et tartalmazó weboldalak listája, a Flash-t alkalmazó oldalak aránya, az alkalmazott képformátumok aránya stb.

Az adatgyűjtés 2010 októberében indult. Jelenleg körülbeül 17 000 vezető weboldal tartalma kerül elemzésre minden második héten.

A HTTP Archive mögött dolgozó kód nyílt forrású, elérhető itt.

A bejelentés itt olvasható.