Duplikátumok összegyűjtése

Fórumok

Sziasztok!

Milyen programot javasoltok a duplikátumok felkutatására, úgy hogy azokat kezelni is tudjam akár egyesével is a keresés után. Több tízezer fájlról van szó: forráskódok, képek, adatok: kicsik, nagyok elégé vegyesen.
Szerk.: az sem baj, ha napokig megy a gép emiatt, ez ilyenkor természetes. Persze a pillanat állj igazi nyalánkság lenne.

Előre is köszönöm a javaslatokat!

Hozzászólások

Régi, de megy wine alatt, tud sok apró hasznos dolgot, pl. csak x méret feletti keresést, automatikusan a végén a legrégebbit meghagyni és a többit törölni, törölt fájlokat naplózni vagy szemetesbe rakni vagy linket rakni a helyére (windows-ost). Próbáld ki, nekem nagyon bevált. Tud pillanat álljt és van prioritás emelés is benne (meg is látszik a sebességén). Van progress bar, élő napló a képernyőn, elég ügyes.

Vagy, tudok adni bash+php script-et, ami hash-eket generál minden fájlból, sql-be menti, onnantól meg rajtad múlik, hogy milyen szűrés alapján mit törölsz.

Pl. tc.

--
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

két funkciója is van, a mappa "szinkronizálás" asszem magyarul pont ilyen néven fut, amit írtál, de a kereső külön tud olyan beállítást, amivel azonos tartalmú (és nevű) fájlokat lehet vele listázni. a probléma vele az komolyabb feladatnál, hogy az eredményét elég nehéz jól kezelni, pl. méret vagy dátum szerint sorbarendezésnél összevonja a listát ami addig szét volt szedve azonos fájlok csoportjaira, ...

én tényleg mindenkinek azt javaslom, hogy ha egy kicsit is tud pl. sql-t kezelni, akkor csináljon egy hash listát a fájlokról, és azt kezelje, onnantól baromi egyszerű legenerálni egy listát, hogy a legrégebbi fájl maradjon meg, vagy a legújabb, lehet törlésre egy egyszerű bash script-et generálni, ...

Pl. tc.

--
"Nem akkor van baj amikor nincs baj, hanem amikor van!"
Népi bölcsesség

Erre a célra csináltam egy toolt nemrégen. Szerintem egész jól sikerült, a saját céljaimnak megfelelt egy rakás régi cuccot rendberaktam vele. Itt van a leírása: https://github.com/rizsi/rdupes

Nagyjából a CPU fizikai képességét teljesen kihasználva végigindexeli a foldereket, és utána változásokat követve kimutatja az egyezéseket.

Java 8 és JavaFX kell hozzá, de ennek ellenére tényleg gyors :-).

ó ez egy külön iparág. Tartalmakat CRC-vel szokták összehasonlítani, de van olyan is hogy hasonló képeket is keresnek.

--
GPLv3-as hozzászólás.

Köszönöm mindenki javaslatát.
A feladatot a dupd-dal elvégeztem.