jsoup - Arbeiten mit URLs
Das folgende Beispiel zeigt Methoden, die sowohl relative als auch absolute URLs auf der HTML-Seite bereitstellen können.
Syntax
String url = "http://www.tutorialspoint.com/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();
System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));
Wo
document - Das Dokumentobjekt repräsentiert das HTML-DOM.
Jsoup - Hauptklasse, um eine Verbindung zu einer URL herzustellen und den HTML-Inhalt abzurufen.
link - Das Elementobjekt repräsentiert das HTML-Knotenelement, das das Ankertag darstellt.
link.attr("href")- liefert den Wert von href, der im Ankertag vorhanden ist. Es kann relativ oder absolut sein.
link.attr("abs:href") - liefert die absolute URL nach dem Auflösen anhand des Basis-URI des Dokuments.
link.absUrl("href") - liefert die absolute URL nach dem Auflösen anhand des Basis-URI des Dokuments.
Beschreibung
Das Elementobjekt stellt eine Domäne dar und bietet Methoden, um sowohl relative als auch absolute URLs abzurufen, die auf der HTML-Seite vorhanden sind.
Beispiel
Erstellen Sie das folgende Java-Programm mit einem beliebigen Editor Ihrer Wahl in C: /> jsoup.
JsoupTester.java
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupTester {
public static void main(String[] args) throws IOException {
String url = "http://www.tutorialspoint.com/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();
System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));
}
}
Überprüfen Sie das Ergebnis
Kompilieren Sie die Klasse mit javac Compiler wie folgt:
C:\jsoup>javac JsoupTester.java
Führen Sie nun den JsoupTester aus, um das Ergebnis anzuzeigen.
C:\jsoup>java JsoupTester
Siehe das Ergebnis.
Relative Link: index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm