mkdir documentation
curlftpfs ftp://ftp.packardbell.com/pub/itemnr/ documentation
Összedobtam egy egyszerű ruby scriptet a másolás elvégzésére:
#!/bin/env ruby
require 'fileutils'
def spider(dir, depth=1)
sleep(2+rand(2))
Dir.glob(File.join(dir, '*')).each { |item|
if File.extname(item)=='.pdf'
puts "Copy: "+item
begin
FileUtils.copy(item, File.join('/mnt/samsung/packardbell',
File.basename(item)))
rescue
nil
end
sleep(2+rand(2))
end
if depth>0 && File.directory?(item) && item != '..' && item != '.'
puts "Check dir: "+item
spider(item, depth-1)
end
}
end
spider('documentation', 1)
~1200 pdf letöltése, több mint 2 Gb letöltése után, már csak meg kellett találni melyik az enyém. Erre a feladatra namazut (http://www.namazu.org) használtam, mert az volt a legegyszerűbb. Nekem elfogyott az összes (1GB) memória a ~300 pdf indexelése után. A --checkpoint paramétert azért adtam meg, mert így néhány fájl indexelése után újraindítja az indexelőt, így nem fogy el a memória. Memory leak vagy mi? (http://www.namazu.org/doc/tips.html.en#saving-memory)
mknmz --checkpoint ../documentation/*.pdf
namazu "easynote sj" .
Szerencsére meglett a keresett leírás, de sajnos még mindig nem tudom melyik könyvtárban volt :).
- vargad blogja
- A hozzászóláshoz be kell jelentkezni
- 1733 megtekintés
Hozzászólások
A code tag elé tegyél egy break taget, mert elrontja az egész blogoldalt. Kösz.
Szerk. A namazuról még nem hallottam, kösz a tippet.
- A hozzászóláshoz be kell jelentkezni
Elnézést, nem vettem észre. Úgy látom Trey már javította, köszönöm.
- A hozzászóláshoz be kell jelentkezni
pdftotext és utána egy grep? :)
Illetve az Adobe Reader (ill. Foxit Reader) tud keresni az összes PDF-ben, ami egy adott könyvtárban van
- A hozzászóláshoz be kell jelentkezni
szerintem ez egyszerűbb, és nem sokkal butább :)
wget -r -A "pdf" -l 2 ftp://ftp.packardbell.com/pub/itemnr/
for i in `find | grep pdf`; do mv $i /mnt/samsung/packardbell; done
—-—-—
int getRandomNumber() {
return 4;//szabályos kockadobással választva.
} //garantáltan véletlenszerű. xkcd
- A hozzászóláshoz be kell jelentkezni
Jó tudni, hogy erre képes a wget is, köszi.
- A hozzászóláshoz be kell jelentkezni