jsoup-HTML 삭제

다음 예제는 XSS 공격 또는 교차 사이트 스크립팅 공격의 방지를 보여줍니다.

통사론

String safeHtml =  Jsoup.clean(html, Whitelist.basic());

어디

  • Jsoup − 주어진 HTML 문자열을 분석하기위한 메인 클래스.

  • html − 초기 HTML 문자열.

  • safeHtml − 정리 된 HTML.

  • Whitelist − html을 보호하기 위해 기본 구성을 제공하는 개체입니다.

  • clean() − 화이트리스트를 사용하여 html을 정리합니다.

기술

Jsoup 객체는 화이트리스트 구성을 사용하여 HTML을 삭제합니다.

C : /> jsoup에서 원하는 편집기를 사용하여 다음 Java 프로그램을 만듭니다.

JsoupTester.java

import org.jsoup.Jsoup;
import org.jsoup.safety.Whitelist;

public class JsoupTester {
   public static void main(String[] args) {

      String html = "<p><a href='http://example.com/'"
         +" onclick='checkData()'>Link</a></p>";

      System.out.println("Initial HTML: " + html);
      String safeHtml =  Jsoup.clean(html, Whitelist.basic());

      System.out.println("Cleaned HTML: " +safeHtml);
   }
}

결과 확인

다음을 사용하여 클래스 컴파일 javac 다음과 같이 컴파일러 :

C:\jsoup>javac JsoupTester.java

이제 JsoupTester를 실행하여 결과를 확인하십시오.

C:\jsoup>java JsoupTester

결과를 확인하십시오.

Initial HTML: <p><a href='http://example.com/' onclick='checkData()'>Link</a></p>
Cleaned HTML: <p><a href="http://example.com/" rel="nofollow">Link</a></p>