FASTA - Format -Datei enthält eine oder mehrere Sequenzen von Nukleotiden in der DNA. Die FASTA Format mit dem FASTA Software-Paket für die DNA-Sequenzierung entstanden , obwohl es geworden ist, ein Standard-Format für die Darstellung von DNA-Sequenzen in der Bioinformatik . FASTA ist ein einfaches Format, das Sequenzen einfach zu analysieren mit Skriptsprachen wie Perl und Python macht . Übersicht
Die Grundlage einer Datei ist eine Zeile, die mit dem Zeichen ">" und gefolgt von Text , den Ursprung der Sequenz. Die Kopfzeile ist in der Regel weniger als 80 Zeichen . Die Linie nach dieser Kopfzeile enthält eine Reihe von Zeichen, die Nukleotide in der DNA oder Aminosäuren in einem Peptid -Sequenz .
Erlaubt DNA Charaktere
Nur sinnvolle Zeichen sind erlaubt als Teil einer Sequenz FASTA . Sequenzen können aus A, C , T, G oder U, entsprechend den Nukleotiden Adenosin , Cytosin , Thymidin , Uracil oder Guanin bzw. bestehen . Jedoch kann die genaue Identität des Nukleotids nicht immer vorhanden sein, von Sequenzierung . FASTA enthält auch Codes , die die möglichen Nukleotide , wenn Unsicherheit vorhanden ist. Der Code wird verwendet, wenn N keine Bestimmung vorgenommen werden kann und X , wenn das Nukleotid durch andere Moleküle maskiert ist. Der Code "-" wird verwendet, um eine Lücke von unbestimmter Länge darstellen
erlaubt Peptide Charaktere
Eine alphanumerische Code kann auch verwendet werden, zu vertreten . die 24 Aminosäuren in einer Peptidsequenz . Wenn ein Peptid nicht ermittelt werden kann , wird der Code X verwendet , ähnlich zu einer DNA-Sequenz . Ein "*" verwendet, um den Terminus oder Translations-Stop- Sequenz eines Peptids anzeigen. Ein "-" . Wird auch verwendet, um eine Lücke in Sequenzdaten für Peptide stellen
Weitere Informationen
Das NCBI setzt einen Standard -Sequenz ID oder SeqID , für den Einsatz in FASTA Kopfzeilen , obwohl es keine endgültige Standard für die Aufnahme in die FASTA Kopfzeile. Ein FASTA Datei mit mehreren Sequenzen wird als Multi- FASTA Datei bekannt. FASTA Dateien kann die Dateiendung " . Fasta ", " . Fna ", " . Ffn ", " . FAA ", " . FRN " oder " . Fas . "