jsoup - URL'lerle çalışmak
Aşağıdaki örnek, html sayfasında bulunan göreli ve mutlak URL'leri sağlayabilen yöntemleri gösterecektir.
Sözdizimi
String url = "http://www.tutorialspoint.com/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();
System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));
Nerede
document - belge nesnesi HTML DOM'u temsil eder.
Jsoup - bir url'ye bağlanmak ve html içeriğini almak için ana sınıf.
link - Öğe nesnesi, bağlantı etiketini temsil eden html düğüm öğesini temsil eder.
link.attr("href")- bağlantı etiketinde bulunan href değerini sağlar. Göreli veya mutlak olabilir.
link.attr("abs:href") - belgenin temel URI'sine göre çözümledikten sonra mutlak url'yi sağlar.
link.absUrl("href") - belgenin temel URI'sine göre çözümledikten sonra mutlak url'yi sağlar.
Açıklama
Öğe nesnesi, bir etki alanını temsil eder ve html sayfasında bulunan mutlak URL'lerin yanı sıra göreli alma yöntemleri sağlar.
Misal
C: /> jsoup gibi herhangi bir düzenleyiciyi kullanarak aşağıdaki java programını oluşturun.
JsoupTester.java
import java.io.IOException;
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupTester {
public static void main(String[] args) throws IOException {
String url = "http://www.tutorialspoint.com/";
Document document = Jsoup.connect(url).get();
Element link = document.select("a").first();
System.out.println("Relative Link: " + link.attr("href"));
System.out.println("Absolute Link: " + link.attr("abs:href"));
System.out.println("Absolute Link: " + link.absUrl("href"));
}
}
Sonucu doğrulayın
Kullanarak sınıfı derleyin javac aşağıdaki gibi derleyici:
C:\jsoup>javac JsoupTester.java
Şimdi sonucu görmek için JsoupTester'ı çalıştırın.
C:\jsoup>java JsoupTester
Sonucu görün.
Relative Link: index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm
Absolute Link: https://www.tutorialspoint.com/index.htm