jsoup - Ekstrak HTML
Contoh berikut akan menunjukkan penggunaan metode untuk mendapatkan html dalam dan html luar setelah mengurai String HTML menjadi objek Dokumen.
Sintaksis
Document document = Jsoup.parse(html);
Element link = document.select("a").first();
System.out.println("Outer HTML: " + link.outerHtml());
System.out.println("Inner HTML: " + link.html());
Dimana
document - objek dokumen mewakili DOM HTML.
Jsoup - kelas utama untuk mengurai String HTML yang diberikan.
html - String HTML.
link - Objek elemen mewakili elemen node html yang mewakili tag jangkar.
link.outerHtml() - Metode outerHtml () mengambil html lengkap elemen.
link.html() - Metode html () mengambil elemen dalam html.
Deskripsi
Objek elemen merepresentasikan sebuah dom elment dan menyediakan berbagai metode untuk mendapatkan html dari sebuah elemen dom.
Contoh
Buat program java berikut menggunakan editor pilihan Anda di katakan C: /> jsoup.
JsoupTester.java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupTester {
public static void main(String[] args) {
String html = "<html><head><title>Sample Title</title></head>"
+ "<body>"
+ "<p>Sample Content</p>"
+ "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
+ "<h3><a>Sample</a><h3>"
+"</div>"
+"</body></html>";
Document document = Jsoup.parse(html);
//a with href
Element link = document.select("a").first();
System.out.println("Outer HTML: " + link.outerHtml());
System.out.println("Inner HTML: " + link.html());
}
}
Verifikasi hasilnya
Kompilasi kelas menggunakan javac kompiler sebagai berikut:
C:\jsoup>javac JsoupTester.java
Sekarang jalankan JsoupTester untuk melihat hasilnya.
C:\jsoup>java JsoupTester
Lihat hasilnya.
Outer HTML: <a href="www.google.com">Google</a>
Inner HTML: Google