Beim Zusammenführen von Daten aus unterschiedlichen Quellen kommt es vor, dass Datensätze doppelt eingefügt werden. Bis Excel 2003 ließen sich solche Dubletten per Spezialfilter aussortieren.
Seit Excel 2007 gibt es den Befehl Duplikate entfernen. Obwohl beide Varianten scheinbar das Gleiche tun, führen sie mitunter zu unterschiedlichen Ergebnissen! Grund genug, die Funktionsweisen genau zu analysieren.
Neu ab Excel 2007: Die Schaltfläche Duplikate entfernen in der Registerkarte Daten und beim Arbeiten mit »intelligenten« Tabellen in der Registerkarte Tabellentools .
Es reicht aus, eine Zelle im zu durchsuchenden Zellbereich zu markieren, bevor ich den Befehl Duplikate entfernen anklicke.
Im sich dann öffnenden Dialogfeld gebe ich an, ob die erste Zeile meiner Liste die Spaltenüberschriften darstellt und welche Spalten Excel zur Suche von Duplikaten verwenden soll.
Excel durchsucht die Liste von oben nach unten. Ein doppelter Datensatz liegt dann vor, wenn es bereits eine Zeile in der Liste gibt, bei der in allen im o.g. Dialogfeld ausgewählten Spalten eine exakte Übereinstimmung vorliegt. Hat Excel eine solche Zeile gefunden, wird sie vollständig gelöscht.
Doppelte Datensätze werden tatsächlich entfernt! Wer also seine Originaldaten nicht ungewollt zerstören möchte, sollte vorher eine Kopie davon anfertigen und mit dieser Kopie arbeiten. Unmittelbar danach lässt sich das Entfernen der Duplikate natürlich noch mit Strg+Z rückgängig machen.
Beim Zusammenkopieren von Datensätzen aus mehreren Quellen kommt es schon mal vor, dass Datensätze unterschiedlich formatiert sind. Um dies zu simulieren, mache ich das Entfernen der Duplikate rückgängig und ändere die Formatierung des Geburtsdatums in Zelle C13 von TT.MM.JJJJ auf TT.MM.JJ. Führe ich nun die Suche nach Duplikaten erneut aus, wird dieser Datensatz nicht als Duplikat erkannt!
Diese Tatsache ist kein Fehler von Excel, sondern in der Hilfe entsprechend dokumentiert: „Doppelte Werte werden durch den Wert bestimmt, der in der Zelle angezeigt wird, und nicht unbedingt durch den in der Zelle gespeicherten Wert.“
Schlussfolgerung: Datensätze müssen vor dem Entfernen von Duplikaten einheitlich formatiert werden.
Im Unterschied zur oben gezeigten Variante ist es bei der Verwendung des Spezialfilters zwingend erforderlich, dass die Spalten Überschriften tragen. Außerdem löscht der Spezialfilter die doppelten Datensätze nicht, sondern blendet sie aus oder erstellt eine Liste der Unikate an einer anderen Stelle.
Es ist wiederum ausreichend, in der Liste eine einzige Zelle zu markieren. Nach einem Klick auf die Schaltfläche Erweitert in der Registerkarte Daten öffnet sich das schon aus früheren Excel-Versionen bekannte Dialogfeld des Spezialfilters.
Ich überprüfe, ob Excel den Listenbereich korrekt erkannt, setze das Häkchen vor „Keine Duplikate“ und klicke ich auf OK.
Excel zeigt mir nun in der Statusleiste wie viele eindeutige Datensätze gefunden wurden. An der Blaufärbung der Zeilennummern (und dem Fehlen einiger Zeilen) erkennen Sie, dass die Duplikate nicht gelöscht, sondern lediglich ausgeblendet wurden.
Anstatt die doppelt vorkommenden Datensätze auszublenden, kann der Spezialfilter die Liste mit Unikaten auch an einer anderen Stelle ausgeben.
Dazu lösche ich zunächst den Filter, klicke wiederum auf Erweitert und wähle die Option An eine andere Stelle kopieren. Dadurch wird es möglich, unter Kopieren nach einen Zielbereich (es reicht eine einzelne leere Zelle) auszuwählen, in den Excel die Liste ausgeben soll. Natürlich setze ich auch wieder das Häkchen vor Keine Duplikate.
Wenn ich den Ausgabebereich mit Spaltenüberschriften versehe, kann ich analog zur Variante mit der Schaltfläche Duplikate entfernen ebenfalls nur bestimmte Spalten zur Suche nach Duplikaten verwenden.
Falls ich im Ausgabebereich des Spezialfilters ein anderes Arbeitsblatt in der gleichen oder einer anderen Arbeitsmappe angebe, quittiert Excel dies mit folgender Fehlermeldung:
Mit einem Trick geht es trotzdem! Ich starte den Spezialfilter in dem Arbeitsblatt (hier: „Ausgabe“), in dem das Ergebnis ausgegeben werden soll und wähle wieder die Option „An eine andere Stelle kopieren“. Anschließend wähle ich manuell den Listenbereich, den Ausgabebereich und setze wieder das Häkchen vor Keine Duplikate – und schon ist die Liste ohne doppelte Datensätze im Blatt „Ausgabe“!
Im Unterschied zur Variante „Duplikate entfernen“ hat der Spezialfilter kein Problem damit, wenn die Daten in den einzelnen Spalten unterschiedlich formatiert sind. Trotz einer Änderung des Zahlenformats des Geburtsdatums in Zelle C13 (siehe oben) wird dieser Datensatz vom Spezialfilter (korrekt) als Duplikat erkannt!
Ich verwende zum Löschen von Duplikaten weiterhin den Spezialfilter, denn
Ich versuche gefilterte Daten die Duplikate zu entfernen (nur die gefilterten), aber Excel entfernt immer Duplikate des gesamten Datenhaushalts.
Weiß jemand wie Excel nur die gefilterten Duplikate entfernt ?
Danke vorab
Christian
Hallo,
vielen Dank! Durch das Kopieren an andere Stelle konnte ich endlich die Duplikate anzeigen.
Grüße
Eric
Mich interessiert, ob es auch möglich ist zwei Listenbereiche durchsuchen zu lassen; z.B. um die Gemeinsamen aus zwei Tabellen (zwei Blätter) in eine neue Tabelle zu überführen?
Vielen Dank.
Das waren gute Ratschläge, doch sehe ich immer noch nicht, welche Daten gelöscht wurden. und genau die möchte ich zuvor kontrollieren!
genial! Das löst sogar Probleme die ich noch gar nicht hatte :-)
@Dirk
Nur nebenbei: Ist das nicht auch das Grundprinzip des Computers ;)
sehr professionell aufgearbeitet. Gute Analyse der beiden Techniken
Super Beitrag und sehr hilfreich!
Ich kannte beide Varianten gar nicht.
Bitte mehr davon!
Über den Autor