Definition

Datenbereinigung (Data Cleaning)

Als Datenbereinigung bezeichnet man den Prozess der Korrektur oder des Entfernens von Daten in beziehungsweise aus einer Datenbank, da sie dort in fehlerhafter, unvollständiger, falsch formatierter oder doppelter Form vorliegen.

In einer Branche, wo große Datenmengen anfallen, wie etwa im Banken- und Versicherungswesen, im Einzelhandel, in der Telekommunikation oder im Transport- und Verkehrsbereich kommt dafür oft ein Werkzeug zum Einsatz, das die Daten systematisch auf Fehler durchforstet. Dies geschieht anhand bestimmter Regeln, Algorithmen und Suchtabellen. 

Üblicherweise gehören zu einem Tool für Datenbereinigung verschiedene Programme, mit denen eine Reihe spezifischer Fehler behoben werden kann, indem zum Beispiel Postleitzahlen eingefügt oder Doppeleinträge ausfindig gemacht werden. Ein solches Tool kann für den Administrator einer Datenbank eine erhebliche Zeitersparnis bedeuten und daher im Vergleich zu einer manuellen Korrektur kostengünstiger sein.

Diese Definition wurde zuletzt im April 2013 aktualisiert

Erfahren Sie mehr über Datenqualität und Datenbereinigung

Diskussion starten

Schicken Sie mir eine Nachricht bei Kommentaren anderer Mitglieder.

Bitte erstellen Sie einen Usernamen, um einen Kommentar abzugeben.

- GOOGLE-ANZEIGEN

File Extensions and File Formats

SearchSecurity.de

SearchStorage.de

SearchNetworking.de

SearchDataCenter.de

Close