? Ein Data Warehouse ist eine relationale Datenbank , eine elektronische Datenbank, in der Daten in Tabellen aus Zeilen und Spalten gespeichert ist. Es ist für die Abfrage und Analyse entwickelt , anstatt jeden Tag Transaktionsverarbeitung. Eine Transaktion ist eine atomare Einheit der Arbeit, wie die Zahlung einer Stromrechnung von Ihrem Bankkonto , die entweder erfolgreich ist oder fehlschlägt. Im Gegensatz zu einem Transaktionsverarbeitungssystem , ist ein Data Warehouse nicht brauchen, um sofort reagieren auf Anforderungen des Benutzers und hat andere einzigartige Eigenschaften . Betreff Oriented
Eine Datenbank soll helfen, Analysten analysieren. Als solche werden die Daten nach Themen , anstatt durch die Anwendung gespeichert , in anderen Worten, die Daten Der genaue Gegenstand kann von Unternehmen zu Unternehmen variieren, aber kann ein Unternehmen beschließen, seine Data-Warehouse durch die Struktur "Subjekt -orientiert." Verkäufe , Lieferungen oder Inventar, so dass es Fragen wie , beantworten kann " Welche Kunden haben die meisten von diesem Produkt im letzten Jahr? "
Extract , Transform and Load
ein weiteres Merkmal eines Data Warehouse ist, dass es an einem Strang ziehen Daten aus verschiedenen operativen Datenbanken , Dateien und Daten -Segmente ; es dann präsentiert sie in einem einheitlichen Format . Dies bedeutet, dass , bevor die Daten in ein Data Warehouse verschoben wird, muss es ein Verfahren, wie Extrakt bekannt zu unterziehen , zu transformieren und zu laden. Zuerst entnimmt dieser Prozess Daten aus einem oder mehreren operativen Datenquellen . Zweitens, entfernt es Unstimmigkeiten aus den Daten , und schließlich , lädt er die Daten in das Data Warehouse . Letztlich bestimmt die Effizienz dieses Prozesses die Qualität der Daten in einem Data Warehouse .
Nonvolatile
Sobald in ein Data Warehouse übertragen , macht die Daten nicht ändern und wird als " flüchtige " beschrieben. die Daten werden nicht beabsichtigt , um den Tag -zu-Tag -Geschäft laufen , im Gegensatz zu Daten in operativen Datenbanken gehalten , es wird nicht nach jeder einzelnen Transaktion aktualisiert. Stattdessen werden die Daten in das Data Warehouse in regelmäßigen , bestimmten Abständen, z. B. einmal pro Tag , einmal pro Woche oder einmal pro Monat übertragen , abhängig von der genauen Art der Daten .
Historische Daten
im Gegensatz zu einem
Transaktionsverarbeitungssystem , in denen historische Daten archiviert , um die Leistung der Datenbank zu erhalten , muss ein Data Warehouse enthalten historische Daten . Um Business-Trends zu identifizieren , Analysten von großen Datenmengen über die Zeit abgetastet erfordern , so enthält ein Data Warehouse historische " Schnappschüsse" von operativen Daten zu bestimmten Zeiten . In anderen Worten, die Daten in einem Data Warehouse als "time -Variante " bezeichnet, weil seine konzentriert sich vor allem im Laufe der Zeit ändern.