Software Datenbanken erhalten Informationen aus einer Vielzahl von Quellen und speichern diese Informationen zur Verwendung von Programmen und Endanwender. Nicht alle Informationen in einem Format , dass eine Datenbank verarbeiten kann vorgestellt , die Daten müssen bestimmte Veränderungen zu unterziehen , um sie kompatibel mit dem Datenbank-Format . Extraktion , Transformation und Laden Verfahren machen es möglich, Informationen, die von einer Datenquelle zu kommen und in die Datenbank geladen werden. Extraction
Extraction ist der Prozess der Übernahme von Daten aus einer Quelle Dateisystem oder einem anderen Ort für eine spätere Aufnahme in eine Datenbank. Wenn die Daten nicht korrekt extrahiert wird dann nachfolgende Prozesse sind wahrscheinlich auf Probleme stoßen , wenn sie nicht völlig scheitern . Extraction ist besonders wichtig für Datenbanken, die Informationen aus verschiedenen Quellen zu ziehen , wie die Dateisysteme, die vom jede Quelle verwendet möglicherweise nicht vollständig kompatibel mit der Datenbank oder miteinander . Mehrere Extraktionsverfahren erforderlich sein, um eine entsprechende Extraktion aus allen Quellen zu gewährleisten.
Transforming
Der Transformationsprozess bereitet extrahierten Daten zum Laden in eine Datenbank. Abhängig von den Ähnlichkeiten zwischen dem Dateisystem von der Datenquelle und dem der Datenbank verwendet wird, kann eine Reihe von Änderungen an den Daten notwendig sein , um es mit der Datenbank- Dateisystem. Diese Änderungen können auch die Zusammenführung verschiedener Datenfelder , die Übersetzung von Daten von einem Format in ein anderes und Anpassungen der Ausrichtung von Datenfeldern , so dass sie das entsprechende Format der Datenbank übereinstimmen .
Loading
Der Ladevorgang dauert Daten transformiert wurde und erzeugt neue Datensätze basierend auf diesen Daten . Diese neuen Datensätze sind in der Standard-Datenbank -Format und kann per Software oder Benutzer mit Anmeldeinformationen oder mit der richtigen Datenbank Administratorrechten aufgerufen werden. Weitere Änderungen können auf die Daten von Nutzern oder Datenbank-Software gemacht werden , wenn diese Änderungen nicht in den Daten noch auf der ursprünglichen Quelle statt reflektiert werden.
Verwendung von ETL-Prozessen
ETL Prozesse sind in Data Warehousing und ähnlichen , bei denen große Mengen von Daten aus einer Reihe von verschiedenen Computern oder Servern gezogen werden . Die drei Verfahren arbeiten zusammen, um sicherzustellen, dass Daten ordnungsgemäß von der Quelle Form in eine Form , die von der zentralen Datenbank ohne Fehler verwendet werden umgewandelt. Ohne den Einsatz von ETL-Prozessen , Daten können falsch in der Datenbank -Format aufgezeichnet oder kann am Ende überhaupt nicht erfasst.