Bei Datenbeständen mit technischen Angaben habe ich schon oft erlebt, dass zahlreiche Spalten nur temporär gebraucht werden oder für die Auswertung nicht von Belang sind. Solche Spalten haben beispielsweise Präfixe wie Sys_oder Tmp_ oder User_.
Um die Datenlast zu reduzieren, sollten solche nicht benötigten Spalten bei der Analyse ausgeschlossen werden.
Doch wie lässt sich das in Power Query automatisieren und wie lassen sich gezielt unnötige Spalten ermitteln? In diesem Power Query Rezept zeige ich, wie mit einer Änderung im M-Code solche Spalten automatisch entfernt werden, ohne die Spaltennamen direkt anzusprechen!
Um ein Muster der M-Code-Anweisung zum Auswählen von Spalten zu erstellen, selektiere ich zunächst manuell einige Spalten. Anschließend ersetze ich im M-Code die Auflistung der Spaltennamen durch eine spezielle Anweisung. So gehe ich vor:
Die Lösung ist damit fertig. Jetzt stellt sich nur noch die Frage, was der oben eingefügte M-Code eigentlich bedeutet. Er liefert eine dynamischen Liste mit den zu behaltenden Spaltennamen.
Diese Frage ist für alle wichtig, die große und sich ändernde Datenbestände aufbereiten und für die Analyse zur Verfügung stellen.
Daher habe ich die Frage mal bei ChatGPT eingegeben. Die Antwort (siehe unten) finde ich informativ, einleuchtend und praxisnah.
Performance-Optimierung
Je kleiner der Datenbestand, desto schneller kann Power Query Transformationen durchführen. Das Reduzieren des Datenvolumens minimiert die benötigte Rechenleistung und Speicheranforderungen, was insbesondere bei großen Datenmengen wichtig ist.
Effizienz bei der Verarbeitung
Filter und Reduktionen, die früh im Query angewendet werden, sorgen dafür, dass nachfolgende Schritte weniger Daten verarbeiten müssen. Das verbessert die Gesamteffizienz der Datenpipeline.
Bessere Lesbarkeit und vereinfachte Wartung
Ein fokussierter Datenbestand ist übersichtlicher und erleichtert es, die relevanten Transformationen und Analysen nachzuvollziehen.
Vermeidung unnötiger Operationen
Das Arbeiten mit irrelevanten Daten (z. B. nicht benötigten Zeilen oder Spalten) kann zu unnötigen Transformationen führen, die die Datenqualität nicht verbessern und Zeit verschwenden.
Wer sein Wissen zu Power Query systematisch auf- und ausbauen will, kann dazu einen meiner Online-Kurse nutzen. Auf dieser Seite ist das aktuelle Angebot zu finden.
TIPP: Wer hier im Blog alle Rezepte zu Power Query finden möchte, gibt einfach oben rechts in das Suchfeld Power-Query-Rezept ein.
- Dipl.-Informatikerin
- Trainerin für Excel und Power BI
- Als erfahrene Datenanalystin Coach für BI-Projekte
- Anwendungsentwicklerin für BI-Tools
- Fachbuchautorin und Bloggerin zu Excel und Power BI
- Video-Trainerin zu Power BI für LinkedIn Learning
- Microsoft Certified Excel Expert
- Microsoft Certified Power BI Data Analyst Associate
Über den Autor