? Eine Spinne ist ein Programm, das Verbindungen zwischen den Web-Seiten protokolliert . Spinnen können in jeder beliebigen Programmiersprache geschrieben werden , einschließlich PHP. Sie können eine Spinne Programm in PHP entweder durch das Herunterladen eines oder schriftlich einen geschrieben. Eine Reihe von spider Funktionsbibliotheken zur Verfügung für PHP. PHP
PHP ist eine Programmiersprache, geschrieben, um dynamische Webseiten zu erstellen. Eine dynamische Web -Seite ist eine, deren Inhalt ändert sich je nach Benutzer oder Aktionen Aufruf Parameter . Web -Seiten werden in der Hypertext Markup Language , oder HTML geschrieben. HTML ist eine Formatierung System jedoch keine Programmiersprache . Web -Seiten werden gespeichert und in ihrem ursprünglichen Zustand ausgeliefert. Diese Form der Datei wird als statische Web -Seite. Webseiten, die von PHP erstellt in Form einer HTML- Vorlage mit Programmcode in den Körper des Dokuments eingefügt . Wenn das Programm aufgerufen wird, werden diese Programmierung Blöcke ausgeführt , anstelle sich mit HTML .
Spinne
Eine Spinne ist auch ein Web-Crawler oder einen Web- Bot genannt . Der Zweck dieser Kategorie Programms ist es, Web -Seiten im World Wide Web zu dokumentieren. Das Programm benötigt eine Web-Seite als Ausgangspunkt . Das ist ein "seed " genannt. Es folgt dann einen Link in dieser Seite auf eine andere Seite und folgt dann auf einen Link in dieser Seite auf eine andere Seite und so weiter. Die Spinne kann geschrieben, um Informationen zu jeder Seite besucht es anmelden, oder einfach nur beachten ihrer Existenz werden. Suchmaschinen-Spider kopieren Sie jede Seite in der Suchmaschine die Datenbank gestoßen , wo andere Programme weitere Analysen durchzuführen. Obwohl viele spider Implementierungen eine Reihe von Aufgaben haben , ist der Akt der Übergang von einer Seite zur anderen die Aufgabe , die das Programm definiert als eine Spinne.
Programmierung Spiders
Obwohl eine Spinne in jeder Sprache geschrieben werden können , Java, Perl und C # sind die beliebtesten Sprachen für diese Programme . Dies ist vor allem, weil Programmierer spezialisiert auf Web-Programmierung mit diesen Sprachen vertraut sind . Python und PHP werden auch verwendet , einmal, weil diese Sprachen haben ein Fähigkeiten bündeln folgenden unter der Web-Community .
Methode
PHP ist in der Regel verwendet, um Web- Seiten zu erzeugen , dass werden dann die anfragenden Web-Browser dargestellt. Web-Browser haben die aktive Rolle der suche eine Website und Ihr Interesse an einer Seite aus dem Web -Server. PHP ist in der Regel die Rolle statisch. Ein PHP-Programm , die als eine Spinne zu Webbrowsern durch Anforderung Webseiten von Webservern zu emulieren. Web -Seiten werden durch das Hypertext Transfer Protocol transportiert . Dies bedeutet nicht, eine Datei herunterzuladen , die die Seite , sondern kopiert den Code für die Seite und führt sie in den Körper der Nachricht reagiert auf eine Anforderung für eine Seite . Die PHP- Spinne hat in den Inhalt der Nachricht zu lesen. Es erfolgt keine Speicherung der Seite , aber scannt eingehende SMS für Web Links. Der Link kann in jedem Format sein, denn HTML speichert Links mit einem Tag wie " " so das Programm muss nur für die Symbole und kopieren den Text schauen , wo " .. . "erscheint in diesem Beispiel. Die Suche in Text und Strippen aus bestimmten Abschnitten wird als " Parsen " in der Programmierung Sprachgebrauch .