Die Rechenleistung von Computern ermöglicht es den Forschern und Unternehmen , um Daten auf komplexere Weise als je zuvor zu analysieren. Datamining ist der Vorgang des Versuchens, nützliche Informationen in großen Datenmengen finden. Data Mining ETL- Prozess bezieht sich auf die Schritte, mit denen Daten erfasst , codiert und in eine Datenbank geschrieben für eine spätere Analyse . Definitionen
Data Mining ist der Prozess der Analyse von Daten und Aggregation es in Informationen, die zu einem nützlichen Zwecke setzen können definiert werden . Die Data Mining-Prozess beinhaltet die Suche nach Mustern in Datensätzen, die kategorische Informationen darüber, wie der Datensatz wird organisiert bereitzustellen. Data Mining kann verwendet werden , um die Beziehung zwischen fast allen messbaren Variablen zu analysieren , ein paar realen Anwendungen von Data Mining eine Analyse der Marketing-Strategien , Produktionsprozesse und menschlichen Verhaltens Tendenzen. Der Begriff ETL ist ein Akronym für Extrahieren, Transformieren und Laden . Extrahieren , Transformieren und Laden beziehen sich auf die drei Prozesse, durch die ein Datenbank-System zur Analyse erstellt wird.
Extraction
Der erste Schritt bei der Erstellung eines Data Warehouse, das kann abgebaut für die Analyse der Daten aus der ursprünglichen Quelle zu extrahieren . Extraktionsverfahren hängt von der Art der Daten, die abgebaut wird abhängig . Manchmal Extraktion beinhaltet Auffinden und Abrufen einer Teilmenge von Daten aus einem oder mehreren vorhandenen Datenbanken . In anderen Fällen erfordert die Extraktion ursprüngliche Forschung , wie die Suche im Internet für Websites, die relevanten Informationen enthalten.
Transform
Sobald entsprechende Daten während gelegen die Extraktion so dass Daten müssen so manipuliert , dass sie in einer Datenbank für eine spätere Analyse gespeichert werden kann . Verfahren zum Ändern der Daten aus der ursprünglichen Form in eine geregelte Form wird als Transformation. Transformation kann es sich um eine beliebige Anzahl von Änderungen an den Daten , einschließlich relativ einfache Funktionen wie das Konvertieren in Kleinbuchstaben und Satzzeichen Entfernen von Zeichenketten . Die Transformation kann auch komplexere Verfahren wie arithmetische Funktionen Quellwerte , Sortieren von Daten und die Überprüfung der Gültigkeit der Quelldaten. Das Ziel der Transformation Phase ist es, die nicht raffiniert Extraktion von Daten zu nehmen und es in Daten , die nützlich für die Ziele des Data Mining-Projekt ist .
Laden
Sobald die Daten in das entsprechende Format umgewandelt wird , muss es in einem Data Warehouse gespeichert werden. Die Last Phase bezieht sich auf den Prozess, durch den Daten in einer Computer-Datenbank angemeldet ist, transformiert . Sobald die Informationen in der Datenbank gespeichert ist , kann es zu qualitativen und quantitativen Analyse unterzogen werden, um nach Mustern von Interesse suchen.