jsoup - HTML'yi temizle

Aşağıdaki örnek, XSS saldırılarının veya siteler arası komut dosyası çalıştırma saldırısının önlenmesini gösterecektir.

Sözdizimi

String safeHtml =  Jsoup.clean(html, Whitelist.basic());

Nerede

  • Jsoup - verilen HTML Dizesini ayrıştırmak için ana sınıf.

  • html - İlk HTML Dizesi.

  • safeHtml - Temizlenmiş HTML.

  • Whitelist - html'yi korumak için varsayılan konfigürasyonları sağlayan nesne.

  • clean() - html'yi Beyaz Listeyi kullanarak temizler.

Açıklama

Jsoup nesnesi, Beyaz Liste yapılandırmalarını kullanarak bir html'yi temizler.

Misal

C: /> jsoup gibi herhangi bir düzenleyiciyi kullanarak aşağıdaki java programını oluşturun.

JsoupTester.java

import org.jsoup.Jsoup;
import org.jsoup.safety.Whitelist;

public class JsoupTester {
   public static void main(String[] args) {

      String html = "<p><a href='http://example.com/'"
         +" onclick='checkData()'>Link</a></p>";

      System.out.println("Initial HTML: " + html);
      String safeHtml =  Jsoup.clean(html, Whitelist.basic());

      System.out.println("Cleaned HTML: " +safeHtml);
   }
}

Sonucu doğrulayın

Kullanarak sınıfı derleyin javac aşağıdaki gibi derleyici:

C:\jsoup>javac JsoupTester.java

Şimdi sonucu görmek için JsoupTester'ı çalıştırın.

C:\jsoup>java JsoupTester

Sonucu görün.

Initial HTML: <p><a href='http://example.com/' onclick='checkData()'>Link</a></p>
Cleaned HTML: <p><a href="http://example.com/" rel="nofollow">Link</a></p>