Google Groups no longer supports new Usenet posts or subscriptions. Historical content remains viewable.
Dismiss

Wie kann ich in Access automatisch Dubletten bereinigen?

17 views
Skip to first unread message

Mucker@discussions.microsoft.com Andreas Mucker

unread,
Nov 29, 2005, 6:00:51 AM11/29/05
to
Ca. 170.000 Datensätze, schätzungsweise 10% davon Dubletten, also zuviel für
eine manuelle Bereinigung...

Gunter Avenius

unread,
Nov 29, 2005, 6:05:26 AM11/29/05
to
Hallo Andreas,

Andreas Mucker schrieb folgendes:


> Ca. 170.000 Datensätze, schätzungsweise 10% davon Dubletten, also
> zuviel für eine manuelle Bereinigung...

Hast Du Dir schon einmal den Abfrage Assistent für die Duplikatsuche
angesehen?

--
Gruß
Gunter
_________________________________________________
Access FAQ: http://www.donkarl.com
home: http://www.avenius.com

Mark Doerbandt

unread,
Nov 29, 2005, 6:09:30 AM11/29/05
to
Hallo, Andreas,

Andreas Mucker:

> Ca. 170.000 Datensätze, schätzungsweise 10% davon Dubletten, also zuviel für
> eine manuelle Bereinigung...

Schau Dir mal in der Online-Hilfe das Stichwort "Duplikatesuche" an,
es gibt dafuer einen Assistenten.

Gruss - Mark

--
Informationen fuer Neulinge in den Access-Newsgroups unter
http://www.doerbandt.de/Access/Newbie.htm

Bitte keine eMails auf Newsgroup-Beiträge senden.

Peter Doering

unread,
Nov 29, 2005, 6:15:19 AM11/29/05
to
Hallo,

Andreas Mucker wrote:

> Ca. 170.000 Datensätze, schätzungsweise 10% davon Dubletten, also zuviel für
> eine manuelle Bereinigung...

Per SQL, wenn trotz Dubletten ein eindeutiges Feld vorhanden ist. Wenn du
wissen willst, wie, poste die Tabellen- u. Feldnamen, an denen jeweils die
Doppelten zu erkennen sind, bzw. welches das eindeutige Feld ist.

Gruss - Peter

--
Ich beantworte keine Fragen per Email.
Mitglied im http://www.dbdev.org
FAQ: http://www.donkarl.com

Andreas Mucker

unread,
Nov 29, 2005, 6:45:03 AM11/29/05
to
Danke Euch!

"Peter Doering" schrieb:

Henry Habermacher [MVP Access]

unread,
Nov 29, 2005, 6:57:44 AM11/29/05
to
Hallo Andreas

quoting Andreas Mucker:
> Ca. 170.000 Datensätze, schätzungsweise 10% davon Dubletten, also
> zuviel für eine manuelle Bereinigung...

Zuerst solltest Du mal beschreiben, was eine Dublette ist. Sind z.B.

P. Mueller
Peter Mueller
Peter Müller
P. Müller

Dubletten Kandidaten, wenn diese alle am gleichen Ort und an der gleichen
oder einer ähnlich geschriebenen Adresse wohnen? Und wie ähnlich ist
ähnlich? Ist Meier = Mayer = Maier = Major?

Oder handelt es sich um echte Dubletten, also eindeutig erkennbare
Dubletten?

Im ersten Fall wirst Du um eine manuelle Bereinigung nicht herumkommen, bei
der aber der Benutzer unterstützt mit Dubletten Kandiaten Suchcode
unterstützt werden sollte. Dieser ist in der Regel ziemlich komplex und die
Soundex Funktion nützt in der deutschen Sprache reichlich wenig, da diese
den Soundex für englisch ausgesprochene Worte zurückgibt, nicht für
deutsche.

Im zweiten Fall kannst Du die Dubletten einfach so eliminieren, indem Du
eine Tabellen Erstellungsabfrage machst, in der Du als Quelle die bestehende
Tabelle angibst, dort aber über alle Felder gruppierst. Danach musst Du nur
noch die Original-Daten durch die so erstellten Datensätze ersetzen. Wird
nicht ganz einfach, wenn Du in Access mit Autowerten gearbeitet hast, was ja
eigentlich meist der Fall ist, weil Du dann keine einziges Duplikat findest.
Du kannst aber über die Felder, welche den eindeutigen Schlüssel ausmachen,
jeweils eine First() Funktion legen, dann kannst Du so reduzieren. Es gibt
aber auch da sicher noch einiges zu tun, wenn Du Beziehungen definiert hast.

HTH
Henry


--
Keine E-Mails auf Postings in NGs senden!
Don't send e-mails to postings in newsgroups!
KB: http://support.microsoft.com/default.aspx
FAQ: http://www.donkarl.com (neu mit Suchfunktion!)
OH: Online Hilfe von Microsoft Access (Taste F1)
Downloads: http://www.dbdev.org

0 new messages