Drei verschiedende Verfahren für Data Profiling

Es existieren eine Vielzahl unterschiedlicher Data-Profiling-Verfahren, die sich in drei Gruppen einteilen lassen: Attribut-Ebene, Datensatz-Ebene und Tabellen-Ebene.

Es gibt eine Vielzahl unterschiedlicher Data-Profiling-Verfahren, die sich in drei Gruppen einteilen lassen:

  1. Attribut-Ebene: Analyse der Werte und Eigenschaften eines Attributs (zum Beispiel einer Tabellenspalte)
  2. Datensatz-Ebene: Analyse aller Sätze einer Struktur (zum Beispiel alle Datensätze einer Tabelle)
  3. Tabellen-Ebene: Analyse aller Beziehungen zwischen Sammlungen von Strukturen (zum Beispiel zwischen Tabellen oder zwischen den Datensätzen einer Tabelle)

Für jede dieser drei Gruppen existiert eine Vielzahl unterschiedlicher Data-Profiling-Verfahren. Diese Verfahren aber nur einzelne Mosaiksteinchen vom Bild der Datenqualität – erst die richtige, projektspezifische Kombination ergibt einen vollständigen Eindruck und sichert den Erfolg.

Die vorwiegend technisch orientierten unterstützten Standard-Verfahren beschränken sich zumeist auf formale Prüfungen (z. B. auf Vollständigkeit) und beinhalten kaum inhaltliche Prüfungen (zum Beispiel auf Korrektheit). Deshalb bleiben die Ergebnisse unvollständig, werden dafür aber von den auf dem Markt verfügbaren Werkzeugen sehr gut unterstützt.

Um die Vollständigkeit und damit die Ergebnisse zu verbessern, sind diese Verfahren um fachliche Geschäftsregeln zu erweitern. Dabei werden die Prozess- und Fachkenntnisse der fachlichen Experten maschinell prüf- und auswertbare Geschäftsregeln überführt. Diese Regeln müssen sich einerseits anhand der Daten validieren lassen, andererseits müssen die Daten damit automatisiert und wiederholbar geprüft werden können.

Standardwerkzeuge bieten derzeit kaum die Möglichkeit zur Ergänzung mit i ndividuellen Geschäftsregeln, sodass man überwiegend auf Nischenanbieter oder Eigenentwicklungen zurückgreifen muss.

Oft findet man auf Konferenzen und in Werbemailings die Angebote von Standardwerkzeughersteller, dass man ihnen seine Daten zum Data Profiling schicken soll. Sie versprechen, dass man so einen realistischen Eindruck von der Qualität seiner Daten erhalte. Neben den rechtlichen Problemen bezüglich der Weitergabe von hochsensiblen Daten an Dritte gibt es noch ein inhaltliches Problem: Wie angesprochen, können nur fachliche Experten mit ausgeprägten Prozesskenntnissen die Ergebnisse und Hinweise der Standard-Verfahren bewerten. Hinzu kommt, dass diese sehr spezifischen Geschäftsregeln bei diesem Check-up naturgemäß nicht verwendet werden. Woher soll der Werkzeughersteller auch die Geschäftsregeln des ihm fremden Unternehmens kennen? Aus diesem Grund ist das Ergebnis in höchstem Maße unvollständig und gibt keinen realistischen Eindruck über die Datenqualität. Solche Check-ups sind allerhöchstens ein erster Schritt; nur harte Arbeit führt zu verwendbaren Ergebnissen. Ein Werkzeug ist und bleibt eben nur ein Werkzeug – auch beim Data Profiling.

Quelle: "Datenqualität erfolgreich steuern", TDWI, 2009.

Über den Autor:

Dr. Carsten Bange ist geschäftsführender Gesellschafter des Business Application Research Centers (BARC). Er ist seit mehr als 10 Jahren für nationale und internationale Unternehmen verschiedenster Branchen und Größen im Rahmen der Strategie- und Architekturberatung, Werkzeugauswahl und Qualitätssicherung in Business-Intelligence- und Datenmanagement-Projekten tätig. Als neutraler Beobachter des Softwaremarktes ist er ein häufiger Redner bei Tagungen und Seminaren sowie Autor zahlreicher Fachpublikationen und Marktstudien.

Folgen Sie SearchEnterpriseSoftware.de auch auf Twitter, Google+ und Facebook!

Artikel wurde zuletzt im Mai 2009 aktualisiert

Pro+

Premium-Inhalte

Weitere Pro+ Premium-Inhalte und andere Mitglieder-Angebote, finden Sie hier.

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Mit dem Absenden dieser Daten erklären Sie sich bereit, E-Mails von TechTarget und seinen Partnern zu erhalten. Wenn Ihr Wohnsitz außerhalb der Vereinigten Staaten ist, geben Sie uns hiermit Ihre Erlaubnis, Ihre persönlichen Daten zu übertragen und in den Vereinigten Staaten zu verarbeiten. Datenschutz

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close