Die FASTA Dateiformat wird verwendet, um die Sequenzdaten von Nukleinsäuren oder Peptiden zu speichern. Multiple -Sequenzen können in einer einzigen Datei gespeichert werden , eine so genannte Multi- FASTA Datei. Sequenzen werden als kurze Kopfzeile Identifizierung der Sequenz und der Sequenz-Daten nach einer neuen Zeile formatiert. Durch die Anordnung der Sequenz -Header in einem Multi- FASTA Datei mit Perl Befehlen ist es möglich, einzelne Sequenzen aus einem Multi- FASTA Datei zu extrahieren. Anleitung
1
Öffnen Sie einen Text -Editor mit einer leeren Textdatei , um eine neue Perl-Programm zu beginnen.
2
Start des Programms durch die Angabe der Lage von Perl auf Ihrem System. Dies ist normalerweise "/usr /bin /perl " oder "/usr /local /bin /perl . "
#! /Usr /bin /perl
3
Import der "strict " und " File :: Basename " Bibliotheken. Die " File :: Basename " Bibliothek unterstützt Parsen von Dateipfade und Erweiterungen. Die "strenge " Bibliothek schränkt unsichere Konstrukte , werfen einen Fehler während der Kompilierung , anstatt zur Laufzeit.
Verwendung strictuse File :: Basename
4
lesen Argumentvariable von der Kommandozeile . Ihr Programm , sollten Sie wählen , es zu benennen " fasta_extract.pl ," wird erwartet, angesichts der Lage eines FASTA Datei und die Parameter zu wählen, um Sequenzen zu extrahieren. Der erste Parameter ein FASTA Dateiname sein und die zweite wird eine Zeichenfolge für den Mustervergleich sein . Argument Variable werden aus der " $ argv " Array abgerufen
my $ fasta_file = $ argv [0]; . My $ pattern = $ argv [1];
5
öffnen die FASTA -Datei mit dem " open () "-Funktion . Sie geben das Programm zu beenden , wenn sie nicht öffnen können, die Datei mit dem "sterben" Befehl
open ( INPUT , $ fasta_file )