Ik heb ook iets dergelijks bij de hand gehad: backups van backups en diverse mappen. Daar kwam bij dat ik nog al mijn mail bewaard had en dezelfde bestanden soms een andere naam hadden. Totaal ging het om 200.000+ bestanden.
Mijn oplossing was alle bestanden in een lijst gooien (incl mapnamen), daarvan de md5 checksum berekenen, vervolgens uitzoeken welke bestanden dezelfde hoeveelheid bytes en dezelfde checksum hadden. Van deze bestanden een laten staan en de rest verwijderen.
Wat je overhoudt kun je vervolgens in een map gooien en uitsplitsen. Je hebt dan alleen nog te maken met bestanden die bv RC_200810A.doc en RC_200810.doc heten en mogelijk dezelfde inhoud hebben.
Klus geklaard met Applescript, Terminal, MS Access (ja sorry, daar heb ik meer verstand van dan Filemaker) & TextWrangler.