Die Idee hinter dem Programm finde ich sinnvoll, wenngleich es schon Programme dieser art gibt, ist es gut es auch selber zu Programmieren, vlt können wir dann auch mal ein Vergleich starten...
Ich wäre Potenziell Interessiert mitzuhelfen, auch wenn ich im Moment eher C# Programmiere, vlt lässt sich auch aus dem Projekt ein .NET/Mono Port basteln um es fürs Wiki zu verarbeiten.
Zum Programm:
Soll es nur ein Duplikatfinder werden, oder ein Dateimanagementprogramm?
Zur Planung:
Gibt es ein SVN/Git-Repo?
Wie wird Programmiert? Einzelne Module à la .dll/etc oder nur die Vergabe von Funktionen die über eine definierte Schnittstelle eine Aufgabe erfüllen sollen?
Zu meinen Ideen:
Duplikate finden, ABER es gibt auch gewollte Duplikate(Backups, Versionen, von Programmen angelegte Ordner), diese sollten nicht gelöscht werden, bzw es sollten Regeln für solche Dateien/Ordner erstellt werden können.
Ergebnisse in eine Datenbank schreiben, in dem Zusammenhang wäre eine Funktion sinnvoll, die versucht aus Dateiendungen und Inhalten Stichwörter zu sammeln, um dann nach diesen zu suchen.
Auch im Kontext der Datenbank: Die Auflistung mit Miniaturanzeige von Bildern, Textdokumenten, evt auch von PDFs und alles was man sonst noch so häufig verwendet/Lesen kann.
Die hier im Forum beteiligten haben allgemein wenig Zeit, das zeigt sich ja auch darin, dass es recht ruhig die letzten Tage ist. Es sind wenig User da, die viele Fragen haben und eigene Projekte wachsen ja auch nicht so schnell, dass man täglich fünf tolle neue Features zur Diskussion stellen kann, wenn man kaum Zeit dafür hat.
Ich hab im Moment schon etwas mehr Zeit, ich habe aber keine Fragen die ich nicht schon selbst beantwortet hätte oder die hier beantwortbar wären, zudem werden auch gerade wenig Fragen gestellt, auf die man Antworten könnte

Redundanz macht wiederholen unnötig.
quod erat expectandum