Den Zwilling des doppelten Bildes finden

22 views
Skip to first unread message

micke...@gmail.com

unread,
May 6, 2023, 3:18:22 PM5/6/23
to PicApport
Hi,

Ich dedupliziere ab und an neue Bilder mit PicApport mit "occurence>1". In der Regel filgen dabei die Duplikat-Paare nahezu aufeinander in der Ansicht. Allerdings gibt es ab und an ein paar False-Positives.

In der Wiki steht, das Metadaten (u.a. Aufnahmezeit) verwendet werden. Es kann sein, das die falschen Dubletten häufig Bilder ohne Metadaten sind, beindenen Aufnahmezeitpunkt = Speicherzeitpunkt (z.B. aus einem Messenger) sind. Das wäre zumindest eine gute Erklärung, da haben manchmal 10 Bilder fast den exakt gleichen Zeitstempel natürlich. 

Meine Frage ist: Wie kann ich gezielt das Duplikat zu einem Bild suchen? So möchte ich manchmal gezielt verifizieren, ob es sich bei einem Listenelement aus occurence>1 wirklich um ein Duplikat oder um ein False-Positive handelt. Die photoids sind ja bei Duplikaten verschieden...


Viele Grüße,
Michael

E. Schreiner

unread,
May 8, 2023, 9:20:57 AM5/8/23
to PicApport
Hallo Michael,
für die Doublettensuche nutzen wir den Fingerprint eines Fotos. Dieser wird grob wie folgt ermittelt:

For a Fingerprint the following information is required in the Metadata:
    - Exif/IFD0: Date Time Foto has been taken
      if available a hashcode(exifhash) will be generated over some data in
      in the Exif/IFD0 and Exif/SubIFD
      also the size of the image will be part of the fingerprint

   - if Datetime is not available a Fingerprint will not be generated and the function returns null

 Ich hoffe, das beantwortet deine Frage - Ohne Metadaten keine Chance ;-)

Gruß Eric

micke...@gmail.com

unread,
May 8, 2023, 1:51:00 PM5/8/23
to PicApport
Leider nicht ganz, aber danke für den Einblick. So etwas in der Richtung hätte ich vermutet. 

Ich habe ja Treffer, also auch Metadaten. Nur sind die leider "glatt gebügelt" gerade, was die Zeiten angeht.

Das heißt also, in einer nach Datum sortierten Ansicht, sollten alle Duplikate direkt nebeneinander liegen. Die Info könnte mein Problem vielleicht auch schon lösen. 

Die Frage war, ob ich von einem Duplikat das andere Duplikat suchen kann. Also alle Bilder, dienein Duplikat eines selektierten Bildes sind; oder anders: Wie ich den Fingerprint anzeigen und/oder als Suchkriterium verwenden kann.

In der Übersicht der Metadaten steht er nicht. Ich vermute, der liegt in der DB und wird beim Crawlen dort abgelegt.

Wie gesagt, vielleicht ist es einfacher, nach dem Zeitstempel zu gehen...

Grüße,
Michael
Reply all
Reply to author
Forward
0 new messages