jsoup - URL'lerle çalışmak

Aşağıdaki örnek, html sayfasında bulunan göreli ve mutlak URL'leri sağlayabilen yöntemleri gösterecektir.

Sözdizimi

String url = "http://www.tutorialspoint.com/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();         

System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));

Nerede

  • document - belge nesnesi HTML DOM'u temsil eder.

  • Jsoup - bir url'ye bağlanmak ve html içeriğini almak için ana sınıf.

  • link - Öğe nesnesi, bağlantı etiketini temsil eden html düğüm öğesini temsil eder.

  • link.attr("href")- bağlantı etiketinde bulunan href değerini sağlar. Göreli veya mutlak olabilir.

  • link.attr("abs:href") - belgenin temel URI'sine göre çözümledikten sonra mutlak url'yi sağlar.

  • link.absUrl("href") - belgenin temel URI'sine göre çözümledikten sonra mutlak url'yi sağlar.

Açıklama

Öğe nesnesi, bir etki alanını temsil eder ve html sayfasında bulunan mutlak URL'lerin yanı sıra göreli alma yöntemleri sağlar.

Misal

C: /> jsoup gibi herhangi bir düzenleyiciyi kullanarak aşağıdaki java programını oluşturun.

JsoupTester.java

import java.io.IOException;

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupTester {
   public static void main(String[] args) throws IOException {
   
      String url = "http://www.tutorialspoint.com/";
      Document document = Jsoup.connect(url).get();

      Element link = document.select("a").first();
      System.out.println("Relative Link: " + link.attr("href"));
      System.out.println("Absolute Link: " + link.attr("abs:href"));
      System.out.println("Absolute Link: " + link.absUrl("href"));
   }
}

Sonucu doğrulayın

Kullanarak sınıfı derleyin javac aşağıdaki gibi derleyici:

C:\jsoup>javac JsoupTester.java

Şimdi sonucu görmek için JsoupTester'ı çalıştırın.

C:\jsoup>java JsoupTester

Sonucu görün.

Relative Link: index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm