Több millió legrégebbi Usenet post archívuma indult el online, lett böngészhető bárki által

Múltkor éppen azon bosszankodtunk, hogy történelmi adatok tűnnek el az internetről. Most egy jó hír érkezett: több millió Usenet post archívuma indult el online, lett böngészhető bárki által, reklámmentesen.

Jozef Jarosciak, a systems architect based in Ontario, had his first encounter with Usenet in 2000, when he found a full-time job in Canada thanks to a job posting there. [...] This week, Jarosciak uploaded some of the oldest Usenet posts available to the internet [...] This latest archive-dump is part of an even larger project by Jarosciak. He launched the Usenet Archive site last month, as a way to host groups in a way that'd be independent of Google Groups, which also holds archives of newsgroups like Usenet. It's currently archiving 317 million posts in 10,000 unique Usenet newsgroups, according to the site—and Jarosciak estimates it'll eventually hold close to 1 billion posts.

Kategóriák:

[ Alt - Comp - Humanities - Microsoft - Misc - News - Rec - Sci - Soc - Talk - Utzoo ]

Statisztika:

Newsgroups 10,859
Posts 347,157,437
Post Processing Rate 0 (posts/day)
Average Post Size 1,098 (bytes)
Database Size 357 GB (7.92%)

Az archívum elérhető itt

Hozzászólások

Nem találom az alt.binaries.pictures.erotica.blondes csoportot. :)

nem lehet valahonnan letolteni az egeszet egyben? NLP-hez jo kis dataset lenne.