jsoup - Ekstrak Teks

Contoh berikut akan menampilkan penggunaan metode untuk mendapatkan teks setelah mengurai String HTML menjadi objek Dokumen.

Sintaksis

Document document = Jsoup.parse(html);
Element link = document.select("a").first();     
System.out.println("Text: " + link.text());

Dimana

  • document - objek dokumen mewakili DOM HTML.

  • Jsoup - kelas utama untuk mengurai String HTML yang diberikan.

  • html - String HTML.

  • link - Objek elemen mewakili elemen node html yang mewakili tag jangkar.

  • link.text() - metode text () mengambil teks elemen.

Deskripsi

Objek elemen merepresentasikan sebuah dom elment dan menyediakan berbagai metode untuk mendapatkan teks dari sebuah elemen dom.

Contoh

Buat program java berikut menggunakan editor pilihan Anda di katakan C: /> jsoup.

JsoupTester.java

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupTester {
   public static void main(String[] args) {
   
      String html = "<html><head><title>Sample Title</title></head>"
         + "<body>"
         + "<p>Sample Content</p>"
         + "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
         + "<h3><a>Sample</a><h3>"
         +"</div>"
         +"</body></html>";
      Document document = Jsoup.parse(html);

      //a with href
      Element link = document.select("a").first();         

      System.out.println("Text: " + link.text());
   }
}

Verifikasi hasilnya

Kompilasi kelas menggunakan javac kompiler sebagai berikut:

C:\jsoup>javac JsoupTester.java

Sekarang jalankan JsoupTester untuk melihat hasilnya.

C:\jsoup>java JsoupTester

Lihat hasilnya.

Text: Google