jsoup - Bekerja dengan URL

Contoh berikut akan menampilkan metode yang dapat memberikan URL relatif serta absolut yang ada di halaman html.

Sintaksis

String url = "http://www.tutorialspoint.com/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();         

System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));

Dimana

  • document - objek dokumen mewakili DOM HTML.

  • Jsoup - kelas utama untuk menyambung ke url dan mendapatkan konten html.

  • link - Objek elemen mewakili elemen node html yang mewakili tag jangkar.

  • link.attr("href")- memberikan nilai dari href yang ada di tag jangkar. Ini mungkin relatif atau absolut.

  • link.attr("abs:href") - menyediakan url absolut setelah menyelesaikannya dengan URI dasar dokumen.

  • link.absUrl("href") - menyediakan url absolut setelah menyelesaikannya dengan URI dasar dokumen.

Deskripsi

Objek elemen merepresentasikan dom elment dan menyediakan metode untuk mendapatkan URL relatif serta absolut yang ada di halaman html.

Contoh

Buat program java berikut menggunakan editor pilihan Anda di katakan C: /> jsoup.

JsoupTester.java

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupTester {
   public static void main(String[] args) throws IOException {
   
      String url = "http://www.tutorialspoint.com/";
      Document document = Jsoup.connect(url).get();

      Element link = document.select("a").first();
      System.out.println("Relative Link: " + link.attr("href"));
      System.out.println("Absolute Link: " + link.attr("abs:href"));
      System.out.println("Absolute Link: " + link.absUrl("href"));
   }
}

Verifikasi hasilnya

Kompilasi kelas menggunakan javac kompiler sebagai berikut:

C:\jsoup>javac JsoupTester.java

Sekarang jalankan JsoupTester untuk melihat hasilnya.

C:\jsoup>java JsoupTester

Lihat hasilnya.

Relative Link: index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm