FASTA ist ein Text -basiertes Format für die Darstellung in der Bioinformatik -Sequenzen , insbesondere diejenigen von Nukleotiden und Peptide verwendet , mit Basenpaare durch einen einzigen Buchstaben dargestellt . Ein FASTA Sequenz besteht aus einer einzeiligen Beschreibung, durch ein " größer als "-Symbol auf der ersten Linie, die von einem mehrzeiligen Nukleotid-oder Peptid-Sequenz gefolgt unterschieden . Sie können mehrere Sequenzen aus einer FASTA Datei mit speziellen Modulen oder Add- ons zu extrahieren, zu der Programmiersprache Perl , wie BioPerl bekannt , die speziell entwickelt, um die FASTA -Format verarbeiten. Sie können auch manuell codieren ein Perl-Skript , um Muster in einer Datei übereinstimmen oder andere zur Verfügung stehende Instrumentarium FASTA Sequenzen extrahieren. Things You
FASTA Datei
Perl Editor
BioPerl
ActiveState Perl
Biopieces
brauchen anzeigen Weitere Anweisungen
1
Starten Sie Ihre Perl Editor-Anwendung . Sie können einen einfachen Text -Editor wie Notepad. Sie müssen die Datei mit einem " . Pl "-Erweiterung speichern , um anzuzeigen, dass es sich um ein Perl -Programm ist .
2
Extrahieren einer Sequenz aus einem Multiple- FASTA -Datei , indem Sie Pattern-Matching in Perl, indem Sie den folgenden Code in den Bearbeiter:
# /usr /bin /perlmy $ fasta_seq = shift; my $ sequence = shift; my $ workfile = ` cat $ fasta_seq ` ; my ($ fasta_seq ) = ! $ workfile = ~ /( > $ sequence [ ^> ] +) /s; print $ fasta_seq ;
3
Extrahieren Sie die Sequenzen aus dem FASTA Datei mit BioPerl . Sie können mehrere Sequenzen , indem Sie den folgenden Code in den Editor extrahieren:
# /bin /perl -w
Nutzung Bio :: SeqIO ;
$ sequenceobject = Bio ! :: SeqIO - > new ( -file = > " fasta_file_path " , -format = > " fasta ");
Die Bio :: SeqIO Modul bietet eine nahtlose Verarbeitung Sequenz . Sie können eine einzelne Sequenz mit der folgenden Anweisung :
$ retrievedsequence = $ sequenceobject -> next_seq ;
Sie können Schleife durch das Objekt und rufen mehrere Sequenzen , wie folgt:
while ($ = $ retrievedsequence sequenceobject -> next_seq ) {print $ retrievedsequence -> seq, "\\ n ";}
4
Extrahieren Sie die Sequenzen aus dem FASTA Datei mit der " Biopieces " -Anwendung, die Rahmenbedingungen , die eine Reihe von modularen Werkzeugen für die Manipulation von Daten der Bioinformatik . Sie führen Ihr Biopieces Befehl auf der Kommandozeile
read_fasta -i fasta_file