Quelleingabedaten (SID) sind die Daten, die Sie als Eingabe für Ihr Modell verwenden möchten. Dabei kann es sich um jede Art von Daten handeln, darunter:
* Strukturierte Daten: Diese Art von Daten wird in einem strukturierten Format gespeichert, beispielsweise in einer Tabellenkalkulation oder einer Datenbank.
* Unstrukturierte Daten: Diese Art von Daten werden nicht in einem strukturierten Format wie Text oder Bildern gespeichert.
SID kann aus verschiedenen Quellen stammen, darunter:
* Interne Daten: Diese Daten werden innerhalb Ihrer Organisation generiert und normalerweise in einer Datenbank oder einem ERP-System (Enterprise Resource Planning) gespeichert.
* Externe Daten: Diese Daten werden außerhalb Ihrer Organisation generiert und können im Internet, in sozialen Medien oder in Regierungsdatenbanken gefunden werden.
Die Qualität Ihres SID ist entscheidend für den Erfolg Ihres Modells. Schlechte Daten führen zu schlechten Ergebnissen. Daher ist es wichtig, dass Sie sich die Zeit nehmen, Ihr SID zu reinigen und vorzubereiten, bevor Sie es zum Modellieren verwenden.
Hier sind einige Tipps zur Vorbereitung Ihres SID:
* Bereinigen Sie Ihre Daten: Dabei werden alle doppelten oder fehlerhaften Daten entfernt.
* Standardisieren Sie Ihre Daten: Dabei werden alle Ihre Daten in ein einheitliches Format konvertiert.
* Anreichern Sie Ihre Daten: Dazu müssen Sie Ihrer SID zusätzliche Daten hinzufügen, beispielsweise demografische Informationen oder Wetterdaten.
Sobald Sie Ihre SID vorbereitet haben, können Sie damit beginnen, Ihr Modell zu erstellen.