AutoIt UDF zum Extrahieren von Informationen aus HTML-Quelltext, mit folgenden Funktionen:
Funktion | Beschreibung |
---|---|
_HTML_ExtractURLVar | Extrahiert eine URL-Variable aus einer URL. |
_HTML_Get | Liefert einen Wert, anhand Verschiedener Atrribute wie: class, id, title usw. |
_HTML_GetAllLinks | Gibt ein Array mit allen Links zurück. |
_HTML_GetImageSrc | Gibt die Quelle eines Bildes zurück. |
_HTML_GetLink | Gibt ein URL zurück, die den Parametern entspricht. |
_HTML_GetSource | Liefert den Quelltext einer Seite zurück. Scripte werden herausgefiltert. |
_HTML_GetTable | Liefert den Inhalt einer Tabelle als 2D-Array. |
_HTML_GetText | Gibt den reinen Text eines Bereiches zurück. |
_HTML_GetURLVar | Liefert eine URL-Variable aus einer URL. |
_HTML_ImageSave | Speicher das angebene Bild ab. |
_HTML_Search | Durchsucht den reinen Text einer Quelle. |
Globale Suchparameter:
$_HTML_SEARCHMODE = 1
;(RegExp: 0 = Compare / 1 = Substring) (String: 2 = Compare / 3 = Substring)
AutoIt
In das AutoIt Include Verzeichnis kopieren.
...
Die Reihenfolge entspricht keiner Priorität.
- Funktion zum Auslesen von Tabellen verbessern.
Thorsten Willert
Das ganze steht unter der Apache 2.0 Lizenz. .