halihó.
adott egy gép, hdd 3 felé particionálva. a 3 partíción [mentésekből egyebekből] kifolyólag (el)borzasztó mennyiségű vegyes adat, ami vajmi kevés tömörített [zip 7z stb] állomány van. vegyes adatok között kb 200-250000 db kép leledzik teljesen kaotikusan. nekem ezek közül kellene egy olyat keresnem, ahol is egy online regisztráció van lefényképezve. annyit tudok róla, hogy a kép kb java része fehér alapú, és szélessége 500px felett van. készítésének idejét nem tudom. azért írtam, hogy kevés a tömörített cucc, mert azokba kézzel bele tudok nézni nem kell kínlódnom.
hogyan keresnéd meg ezt a képet? van valami program amivel a kép fő színéből is lehetne keresni vagy szortírozni? végül is nagyon fontos hogy meglegyen, oprendszer mindegy mi lenne a program alatt. próbáltam "kézzel" keresni, egynegyedéig jutottam egy óra alatt és nem biztos hogy nem haladtam túl a cuccon [figyelmetlenség vagy hibás képindex]. már az is segítség lenne, ha nem kellene a 300e képen rohangálni, hanem csoportban láthatnám a világosakat és így lenne mondjuk 50e kép.
köszönöm előre.
- 1145 megtekintés
Hozzászólások
arra gondoltam, h vmi karakterfelismerő progin próbálnám átküldeni a képeket (vagy az nagyon lassú?) és szövegre próbálnék keresni
- A hozzászóláshoz be kell jelentkezni
250e képnél nagyon nagyon lassú, sajnos sok gigában mérhető az alapanyag.
--
Vége a dalnak, háború lesz...
- A hozzászóláshoz be kell jelentkezni
Időben érdemes leszűrni.
- A hozzászóláshoz be kell jelentkezni
Az imagemagick identify parancsával biztosan meg lehet oldani.
Talán célszerű több lépésben dolgozni: első körben összegyűjtöd egy fájlba azoknak a képeknek a listáját, amelyek egyáltalán szóba jöhetnek. (Pl. ha emlékszel, hogy nagyjából melyik könyvtárban lehetett. A lemezborítók és a tavalyi nyaralás képei közé csak nem raktad.)
Aztán kiszűröd azokat, amelyek 500 pixelnél szélesebbek, ez triviális (identify -format mittomén).
Végül a megmaradóakból kiszűröd azokat, amelyeknek kellően világos az alapszíne.
Ez kevésbé triviális. Kezdheted itt a tájékozódást:
http://www.imagemagick.org/Usage/compare/
- A hozzászóláshoz be kell jelentkezni
imagemagick idenfity-vel próbálkoznék, nézz rá, hátha fel tudod használni előszűrésnek
http://www.imagemagick.org/script/identify.php
- A hozzászóláshoz be kell jelentkezni
Lehet, hogy én külön programot nem írnék rá. Egy file-szintű keresés eredményeként "összehánynám" egybe (vagy legalábbis 1-2 könyvtárba) az összes képállományt, esetleg már a keresésnél kiszűrve az irreálisan nagy / kicsi file-méreteket, aztán valamilyen képnézegető progiban thumbnail szinten átnézném, képméret szerint rendezve.
- A hozzászóláshoz be kell jelentkezni
Eloszures utan a vilagossagra egy (nem tul hatekony) modszer.
convert screenshot_01.png /tmp/x.h
tr ' ,' "\n" /tmp/x.h|grep 0x|sort|uniq -c
Ha sok a 0xFF, akkor sok a feher (esetleg atvalthatod elotte greyscale-re).
Ha talalsz ra programot, azzal jobban jarsz, ez a "quick and dirty hack" kategoria.
--
To celebrate the Beatles' arrival on iTunes in 2010, I'm listening to their MP3s I downloaded from Napster in 2001.
- A hozzászóláshoz be kell jelentkezni
A kérdés, hogy mennyire kell a kép.
Ha nagyon-nagyon-nagyon, és megér pár óra munkát, akkor érdemes rá programot írni.
Hozzáteszem, nálam mindig olyan rend van, hogy évek múlva is megtalálok mindent.
És mindenre van egy megfelelő szkriptem/programom/forgatókönyvem.
Úgy vagyok vele, hogy inkább előre szeretek gondolkodni, mint utólag kapkodni és esetleg hibázni.
Fuszenecker Róbert
- A hozzászóláshoz be kell jelentkezni
+1 Jó gondolkodás! :)
És az archiválás is logikus, gyors és könnyen visszaállítható.
- A hozzászóláshoz be kell jelentkezni
Mondanom sem kell: utils/archive a szkriptem neve :-)
Betömöríti az anyagaimat tar-ral és lzma-val, 100 megabájtos darabokra szeleteli, és 8×100 megabájt hibajavító adatot ad hozzá. DVD-nél sosem lehet tudni...
Fuszenecker Róbert
- A hozzászóláshoz be kell jelentkezni
tineye.com
gyere rá hogy müködik :)
- A hozzászóláshoz be kell jelentkezni
Ha vegul irodik ra valami program, lathatjuk majd? (subscribe)
- A hozzászóláshoz be kell jelentkezni