Daten -Dateien müssen eine Struktur , damit die Benutzer bestimmen, welche Art von Daten sie sind auf der Suche . Ein Weg, um diese Dateien zu strukturieren ist, Trennzeichen zwischen den Datenfeldern und am Ende der Datensätze einzufügen. Verschiedene Arten von Dateien haben unterschiedliche Trennzeichen . Das Trennzeichen verwendet wird, hängt von der Art der Daten die Datei und die Datenfelder enthalten . Database -Programme können oft erkennen die Art der Datei mit Trennzeichen , und wandeln es in der Standard- Trennzeichen das Programm verwendet. Grundlegende Datei- Struktur
getrennte Dateien enthalten Daten in Felder und Datensätze . Die Trennzeichen anzugeben, welche Daten gehören zusammen in einem Feld , und die Felder bilden einen Datensatz . Ein Feld ist ein einzelner Datenpunkt während einer Aufnahme ist eine Sammlung von Datenpunkten, die auf dasselbe Element beziehen . Ein typisches Beispiel ist eine Kundenliste , die Felder zeigt Name, Alter, Adresse und Telefonnummer hat . Diese Felder bilden eine Aufzeichnung , die sich auf den gleichen Kunden . Die meisten Daten -Dateien haben einen Datensatz pro Zeile , aber getrennten Feldern mit einer Vielzahl von Trennzeichen .
Komma getrennte Dateien
Die häufigste Art der getrennten Datei ist eine Datei mit komma-getrennt - Werte oder . CSV . Die Dateien müssen einem Datensatz pro Zeile , und die Felder haben Kommata zwischen ihnen. Die meisten Datenbank-Programme lesen kann. CSV-Dateien , wandeln sie in ihre eigenen nativen Format exportieren und sie für den Einsatz in anderen Programmen. Ein wesentliches Problem für . CSV -Dateien einschließlich der Daten , die Kommas enthält . Datenverarbeiter muss entweder entfernen Sie die zusätzlichen Kommas während Datenvalidierung oder nicht- Standard- Workarounds wie umschließt das Feld in Anführungszeichen .
Tabulatorgetrennt Files
< p> Daten mit komplexen Textstruktur oft muss Kommas um verständlich sein . Aus diesem Grund verwenden viele große Datenbanken andere als Trennzeichen Kommas. Eine beliebte Alternative ist die tabulatorgetrennten oder tab- getrennte Werte ( . TSV -Datei). Die meisten Datenbank- Programme können diese Dateien lesen , und sie haben den Vorteil, dass sie ordentlich Spalten zu erzeugen, mit den linken Seiten der Daten aufgereiht, wenn Sie sie in Textverarbeitungsprogrammen öffnen.
Andere Trennzeichen
Die zweithäufigste getrennte Dateien sind diejenigen mit Doppelpunkte als Trennzeichen . Doppelpunkte leiden unter dem gleichen Problem wie Komma , wenn die Daten enthält Doppelpunkte in seinem Text. Ähnliche anderen alternativen Trennzeichen sind Semikolons und Leerzeichen . Datendateien verwenden diese Trennzeichen je nachdem, ob die Daten enthält das Trennzeichen . Einige Programme können Sie jedes beliebige Zeichen als Trennzeichen für eine bestimmte Datei wählen, aber diese Dateien möglicherweise nicht kompatibel mit anderen Datenbank-Programme .