Phasen in Data Warehousing und Business Analytics
1. Datenextraktion :Daten werden aus verschiedenen Quellen wie relationalen Datenbanken, Flatfiles und Protokolldateien extrahiert.
2. Datenbereinigung :Daten werden bereinigt, um Fehler und Inkonsistenzen zu beseitigen.
3. Datentransformation :Daten werden so transformiert, dass sie mit dem Data Warehouse-Schema kompatibel sind.
4. Datenintegration :Daten aus unterschiedlichen Quellen werden in das Data Warehouse integriert.
5. Laden von Daten :Daten werden in das Data Warehouse geladen.
6. Datenspeicherung :Daten werden zur Analyse im Data Warehouse gespeichert.
7. Datenanalyse :Daten werden mithilfe verschiedener Techniken wie deskriptiver Statistik, prädiktiver Modellierung und Datenvisualisierung analysiert.
8. Business Intelligence :Business-Intelligence-Tools werden verwendet, um Daten für Entscheidungsträger aussagekräftig darzustellen.
9. Data Mining :Data-Mining-Techniken werden verwendet, um verborgene Muster und Trends in Daten aufzudecken.
10. Entscheidungsfindung :Datengesteuerte Entscheidungen werden auf der Grundlage der Erkenntnisse aus der Geschäftsanalyse getroffen.
Kurze Erklärung
Datenextraktion umfasst das Abrufen von Daten aus verschiedenen Quellen wie relationalen Datenbanken, Flatfiles und Protokolldateien. Die Daten können strukturiert, halbstrukturiert oder unstrukturiert sein.
Datenbereinigung ist der Prozess der Beseitigung von Fehlern und Inkonsistenzen aus Daten. Dies kann das Korrigieren ungültiger Werte, das Entfernen doppelter Datensätze und die Behandlung fehlender Daten umfassen.
Datentransformation Dabei werden Daten aus ihrem ursprünglichen Format in ein Format konvertiert, das mit dem Data Warehouse-Schema kompatibel ist. Dies kann das Ändern des Datentyps, das Umbenennen von Feldern sowie das Teilen oder Kombinieren von Datensätzen umfassen.
Datenintegration ist der Prozess der Kombination von Daten aus verschiedenen Quellen in einer einzigen, einheitlichen Ansicht. Dies kann die Lösung von Datenkonflikten, wie z. B. doppelten Datensätzen oder unterschiedlichen Datenformaten, beinhalten.
Laden von Daten beinhaltet das physische Laden von Daten in das Data Warehouse. Dies kann mittels Stapelverarbeitung oder Echtzeit-Streaming erfolgen.
Datenspeicherung beinhaltet das Speichern von Daten im Data Warehouse zur Analyse. Die Daten können in einer relationalen Datenbank, einer Data Warehouse-Appliance oder einem cloudbasierten Data Warehouse gespeichert werden.
Datenanalyse Dabei werden verschiedene Techniken eingesetzt, um Daten zu analysieren und Erkenntnisse zu gewinnen. Dies kann deskriptive Statistik, prädiktive Modellierung und Datenvisualisierung umfassen.
Business Intelligence Mithilfe von Tools werden Daten so dargestellt, dass sie für Entscheidungsträger aussagekräftig sind. Dies kann die Erstellung von Berichten, Dashboards und Visualisierungen umfassen.
Data Mining Techniken werden verwendet, um verborgene Muster und Trends in Daten aufzudecken. Dies kann Clustering, Assoziationsregel-Mining und Klassifizierung umfassen.
Entscheidungsfindung Dabei geht es darum, datengesteuerte Erkenntnisse zur Entscheidungsfindung zu nutzen. Dies kann die Entwicklung von Strategien, die Festlegung von Zielen und die Zuweisung von Ressourcen umfassen.