jsoup - Arbeiten mit URLs

Das folgende Beispiel zeigt Methoden, die sowohl relative als auch absolute URLs auf der HTML-Seite bereitstellen können.

Syntax

String url = "http://www.tutorialspoint.com/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();         

System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));

Wo

  • document - Das Dokumentobjekt repräsentiert das HTML-DOM.

  • Jsoup - Hauptklasse, um eine Verbindung zu einer URL herzustellen und den HTML-Inhalt abzurufen.

  • link - Das Elementobjekt repräsentiert das HTML-Knotenelement, das das Ankertag darstellt.

  • link.attr("href")- liefert den Wert von href, der im Ankertag vorhanden ist. Es kann relativ oder absolut sein.

  • link.attr("abs:href") - liefert die absolute URL nach dem Auflösen anhand des Basis-URI des Dokuments.

  • link.absUrl("href") - liefert die absolute URL nach dem Auflösen anhand des Basis-URI des Dokuments.

Beschreibung

Das Elementobjekt stellt eine Domäne dar und bietet Methoden, um sowohl relative als auch absolute URLs abzurufen, die auf der HTML-Seite vorhanden sind.

Beispiel

Erstellen Sie das folgende Java-Programm mit einem beliebigen Editor Ihrer Wahl in C: /> jsoup.

JsoupTester.java

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupTester {
   public static void main(String[] args) throws IOException {
   
      String url = "http://www.tutorialspoint.com/";
      Document document = Jsoup.connect(url).get();

      Element link = document.select("a").first();
      System.out.println("Relative Link: " + link.attr("href"));
      System.out.println("Absolute Link: " + link.attr("abs:href"));
      System.out.println("Absolute Link: " + link.absUrl("href"));
   }
}

Überprüfen Sie das Ergebnis

Kompilieren Sie die Klasse mit javac Compiler wie folgt:

C:\jsoup>javac JsoupTester.java

Führen Sie nun den JsoupTester aus, um das Ergebnis anzuzeigen.

C:\jsoup>java JsoupTester

Siehe das Ergebnis.

Relative Link: index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm