jsoup - Ikhtisar

jsoup adalah pustaka berbasis Java untuk bekerja dengan konten berbasis HTML. Ini menyediakan API yang sangat nyaman untuk mengekstrak dan memanipulasi data, menggunakan metode DOM, CSS, dan seperti jquery terbaik. Ini mengimplementasikan spesifikasi HTML5 WHATWG, dan mengurai HTML ke DOM yang sama seperti yang dilakukan browser modern.

jsoup libary mengimplementasikan spesifikasi WHATWG HTML5, dan mengurai konten HTML ke DOM yang sama sesuai browser modern.

perpustakaan jsonp menyediakan fungsi berikut.

  • Multiple Read Support - Itu membaca dan mem-parsing HTML menggunakan URL, file, atau string.

  • CSS Selectors - Dapat menemukan dan mengekstrak data, menggunakan traversal DOM atau pemilih CSS.

  • DOM Manipulation - Dapat memanipulasi elemen HTML, atribut, dan teks.

  • Prevent XSS attacks - Dapat membersihkan konten yang dikirimkan pengguna terhadap daftar putih aman yang diberikan, untuk mencegah serangan XSS.

  • Tidy - Ini menghasilkan HTML yang rapi.

  • Handles invalid data - jsoup dapat menangani tag yang tidak tertutup, tag implisit, dan dapat dengan andal membuat struktur dokumen.