jsoup - Vệ sinh HTML
Ví dụ sau sẽ giới thiệu việc ngăn chặn các cuộc tấn công XSS hoặc cuộc tấn công kịch bản trên nhiều trang web.
Cú pháp
String safeHtml = Jsoup.clean(html, Whitelist.basic());
Ở đâu
Jsoup - lớp chính để phân tích cú pháp chuỗi HTML đã cho.
html - Chuỗi HTML ban đầu.
safeHtml - HTML sạch.
Whitelist - Đối tượng cung cấp cấu hình mặc định để bảo vệ html.
clean() - làm sạch html bằng cách sử dụng Danh sách trắng.
Sự miêu tả
Đối tượng jsoup khử trùng một html bằng cách sử dụng cấu hình Danh sách trắng.
Thí dụ
Tạo chương trình java sau bằng cách sử dụng bất kỳ trình soạn thảo nào bạn chọn trong C: /> jsoup.
JsoupTester.java
import org.jsoup.Jsoup;
import org.jsoup.safety.Whitelist;
public class JsoupTester {
public static void main(String[] args) {
String html = "<p><a href='http://example.com/'"
+" onclick='checkData()'>Link</a></p>";
System.out.println("Initial HTML: " + html);
String safeHtml = Jsoup.clean(html, Whitelist.basic());
System.out.println("Cleaned HTML: " +safeHtml);
}
}
Xác minh kết quả
Biên dịch lớp bằng cách sử dụng javac trình biên dịch như sau:
C:\jsoup>javac JsoupTester.java
Bây giờ hãy chạy JsoupTester để xem kết quả.
C:\jsoup>java JsoupTester
Xem kết quả.
Initial HTML: <p><a href='http://example.com/' onclick='checkData()'>Link</a></p>
Cleaned HTML: <p><a href="http://example.com/" rel="nofollow">Link</a></p>