állítólag valami Archive.org-os speckó formátumban van, még nem álltam neki feldolgozni. A siterip maga "csak" 14x 5 giga, de nem tudtam még belenézni ez mennyiről lett összenyomva ekkorára. Ezért kicsomagolva simán lehet 1-1,5TB is. A fájl lista meg gondolom ilyen százezres nagyságrendű lehet, cikkenként a HTM, a tucat JS, meg a töméntelen kép. Keresni remélhetőleg értelmesen lehet majd benne. Adtak hozzá egy "kicsi" (600MB?) metadata fájlt, ezt sem tudom hogyan kell kombinálni a nagy csomaggal.
És amúgy itt ütközik ki annak a buzi szokásnak a hátránya, amit az összes kattingatásvadász média (köztük a hwsw is!) lelkesen művel, hogy a title nem tartalmazza sem azokat a kulcsszavakat, amik az adott cikket jól leírják, sem magát a témát nem lehet belőlük kideríteni. Innentől sok sikert megtalálni a Ryzen 3990x tesztet, ha a gyökér firkász csak azt a címet adta a cikknek, hogy: "Teszten a legerősebb threadripper!444!!!"
Akkor aztán generáltathatod erre a másfél TB-ra a full-text-search indexet is, h. esélyed legyen benne majd megtalálni bármit is.