jsoup - Ekstrak Teks
Contoh berikut akan menampilkan penggunaan metode untuk mendapatkan teks setelah mengurai String HTML menjadi objek Dokumen.
Sintaksis
Document document = Jsoup.parse(html);
Element link = document.select("a").first();
System.out.println("Text: " + link.text());
Dimana
document - objek dokumen mewakili DOM HTML.
Jsoup - kelas utama untuk mengurai String HTML yang diberikan.
html - String HTML.
link - Objek elemen mewakili elemen node html yang mewakili tag jangkar.
link.text() - metode text () mengambil teks elemen.
Deskripsi
Objek elemen merepresentasikan sebuah dom elment dan menyediakan berbagai metode untuk mendapatkan teks dari sebuah elemen dom.
Contoh
Buat program java berikut menggunakan editor pilihan Anda di katakan C: /> jsoup.
JsoupTester.java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupTester {
public static void main(String[] args) {
String html = "<html><head><title>Sample Title</title></head>"
+ "<body>"
+ "<p>Sample Content</p>"
+ "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
+ "<h3><a>Sample</a><h3>"
+"</div>"
+"</body></html>";
Document document = Jsoup.parse(html);
//a with href
Element link = document.select("a").first();
System.out.println("Text: " + link.text());
}
}
Verifikasi hasilnya
Kompilasi kelas menggunakan javac kompiler sebagai berikut:
C:\jsoup>javac JsoupTester.java
Sekarang jalankan JsoupTester untuk melihat hasilnya.
C:\jsoup>java JsoupTester
Lihat hasilnya.
Text: Google