Beim Computer ist ein Data Warehouse ein zentrales Repository von integrierten Daten aus einer oder mehreren unterschiedlichen Quellen. Es ist für die analytische Verarbeitung und die Unterstützung von Aktivitäten für Business Intelligence (BI) wie Berichterstattung, Analyse und Data Mining entwickelt. Im Gegensatz zu einer typischen operativen Datenbank (wie der für die Transaktionsverarbeitung verwendeten) konzentriert sich ein Data Warehouse auf die Bereitstellung historischer Daten für strategische Entscheidungen, anstatt den täglichen Betrieb zu unterstützen.
Schlüsselmerkmale eines Data Warehouse:
* Subjektorientiert: Die Daten werden in bestimmten Geschäftsthemen (z. B. Kunden, Produkte, Verkäufe) und nicht operative Prozesse organisiert.
* integriert: Daten aus verschiedenen Quellen sind konsolidiert und standardisiert, um eine Konsistenz sicherzustellen. Dies beinhaltet häufig die Lösung von Inkonsistenzen in Datenformaten und die Benennung von Konventionen.
* Zeitvariante: Die Daten werden historisch gesehen gespeichert, wodurch die Analyse von Trends im Laufe der Zeit ermöglicht wird. Dies beinhaltet das Erfassen von Daten zu verschiedenen Zeitpunkten.
* Nichtflüchtig: Daten in einem Data Warehouse sind in der Regel nur schreibgeschützt. Aktualisierungen erfolgen eher über ETL -Prozesse (Extrakt, Transformation, Last) als über direkte Modifikationen.
Im Wesentlichen bietet ein Data Warehouse eine einzige konsistente Sichtweise der Geschäftsdaten, die es Analysten und Entscheidungsträgern erleichtert, Trends, Muster und Leistung zu verstehen. Dies steht im Gegensatz zu operativen Datenbanken, die für die Geschwindigkeit und Effizienz von Transaktionen optimiert sind.