Die Sprache VB.NET enthält eine HTML-Parsing Klasse, die Sie verwenden, um HTML -Werte aus Webseiten zu extrahieren. Verwenden Sie die analysierten Daten , um Inhalte auf einer Website ausgewertet und die Informationen zu einem Benutzer oder lagern Sie den extrahierten Informationen in einer Datenbank. Die HTML-Parsing -Klasse können Sie lesen Textinhalt oder keine Werte in Form Elemente wie Textfelder oder Drop-Down- Boxen. Anleitung
1
Öffnen Sie die Visual Studio -Software in der " Microsoft. NET Framework " Programmgruppe. Öffnen Sie Ihr Projekt nach VB Visual Studio Lasten.
2
der rechten Maustaste auf den Namen des Projekts in der " Explorer "-Panel und wählen Sie "Eigenschaften". Klicken Sie auf die " . NET "-Registerkarte, doppelklicken Sie dann auf die DLL-Datei mit dem Namen " Microsoft.mshtml . " Diese DLL enthält die Klassen, um HTML zu analysieren.
3
Fügen Sie die Bibliothek der VB-Code Datei, die Sie verwenden möchten, um die HTML analysieren. Kopieren Sie den folgenden VB -Anweisung am Anfang der Codedatei :
Importe mshtml
4
Instanziieren die " HTMLDocument " Klasse. Diese Klasse importiert den HTML Text, den Sie von einer Webseite oder String importiert und stellt die Information für die Analyse . Fügen Sie den folgenden Code auf Ihre Parsing-Funktion :
Dim ParseHTML Wie IHTMLDocument2 = New HTMLDocumentClass () Dim HTMLData Wie IHTMLElementCollection = parseHTML.body.all
5
Inhalt Abrufen von HTML-String . Zum Beispiel Der folgende Code ruft den Wert aus einem HTML- Textfeld auf einer Webseite :
Dim tbData Wie IHTMLInputElement = allElements.item ( " textbox1 " ) MsgBox "Dies ist die Daten in das Textfeld ist : "& tbData.Value