Máte složku s obrázky a chcete vyházet duplicitní. Metody porovnávání podle jména, velikosti či dokonce obsahu (CRC, md5) už udělaly svoje – většinou s nevalným výsledkem. Stále je tam mnoho duplicit. Ze všech vizuální porovnávačů (i placených), které jsem před dvěma roky zkoušel, vyšel nejlépe Dup Detector. Poslední verze 3.201 je ke stažení třeba ze Slunečnice – vývoj programu byl bohužel ukončen v roce 2005 a firma Prismatic Software už zřejmě neexistuje.
Program podporuje následující formáty (vzato z nápovědy):
JPG, BMP, PNG, TIFF (non-LZW compressed), PCX, TGA, WMF, EMF, and PSD (compacted)
GIF tedy bohužel ne :-(
1) Volba porovnávání
Vybereme si tedy metodu porovnávání č. 1 (1 balík obrázků a porovnávání mezi sebou navzájem). Zbylé metody slouží např. k porovnávání nových obrázků vůči starým.
A začneme ho krmit daty – přepneme na záložku Get Data.
2) Nakrmit program obrázky
Tady máme dvě možnosti – buď otevřít starý datafile (soubor s údaji o obrázcích) nebo ho vytvořit. Děláme to poprvé, zvolíme si tedy Build.
A máme opět dvě možnosti. Buď nám stačí jedna složka k porovnání, nebo si můžeme vytvořit seznam složek, které bude prohledávat. Variantu A pomineme (vy ji ale nejspíš použijete) a probereme zvláštnosti varianty B. (Můžete tedy skočit rovnou na Zpracování obrázků.)
Pomocí tlačítka Browse vyberte, kam chcete seznam uložit.
POZOR 1: cesta by neměla obsahovat mezery – jinak vám soubor nepůjde upravit (Edit..)! Pokud obsahuje, jako v tomto případě, musíte cestu uzavřít do uvozovek, jinak uvidíte výše zobrazenou chybu. Správná cesta tedy bude vypadat „C:\Program…….list.lst“.
POZOR 2: Až budete mít seznam hotový, musíte uvozovky opět odstranit! Jinak vám hodí chybu při kliku na OK. (Je to jediná hloupá chyba v jinak skvělém programu, kterou nemá kdo opravit. Není to holt Open Source.)
Pak klikněte na Edit.
Objeví se vám seznam složek, kam si postupně přidáváte další složky. Uložte si ho a klikněte na OK a pak opět na OK (nezapomeňte na uvozovky).
3) Zpracování obrázků
Program začne zpracovávat obrázky – chvilku to trvá a trošku to zatěžuje počítač. Pak se dostáváme na záložku Find dups.
Tady si můžete vybrat metody porovnávání (Setup) a procento souhlasu.
Doporučení:
Neklesejte pod 98%, hází to potom moc – statistik by řekl falešně pozitivních párů (FP – tedy párů, které program označí za podobné, ač nejsou) – obecně nejméně FP má metoda Variance, ale ne vždy něco kloudného najde.
Duplicity se dají najít i při 96% (při 98% byly tedy falešně negativní :-)), ale počet FP je pak vysoký – i tisíce. Program bohužel nemá blacklist, na který by uživatel dal páry, které se opravdu nepodobají – zobrazují se mu tedy pořád dokola.
Na porovnávání používám Luminance, pak Euclidean, příp. Variance – v tomto pořadí. Luminance obvykle zachytí nejvíce při nejmenším počtu FP.
4) Výsledky
A jsme na výsledcích (záložka View dups). Pomocí Back a Next se pohybujete mezi páry, pomocí Delete mažete obrázek vpravo nebo vlevo. Až budete hotovi, nezapomeňte si to uložit (Data -> Save as), příště si ušetříte proceduru analýzy obrázků.
Tipy na závěr.
Pokud do složky přidáte nové obrázky, načtěte přes Data -> Open váš starý datafile a přes Data -> Fast rebuild jej aktualizujte.
Zvolte si následující konfigurace:
View -> Sort high-to-low % match – seřadí vám páry podle shody sestupně.
View -> Large size dropdown view – zobrazí vám obrázky velké – abyste pořádně viděli, co se porovnává. Obrázek si můžete zvětšit i pravým klikem na něj a volbou Open Image – otevře vám ho ve Vašem prohlížeči obrázků.
Options -> Show Find dups a Show View dups – udělají přesuny mezi záložkami za Vás.
Options -> Show file sizes a Manual delete. Nepoužívejte raději automatiku! – FP vzpomínáte :-).
To je vše, přátelé :-)
Bohužel, pod Wine se mi na první pokud rozjet nepodařilo.