jsoup-텍스트 추출
다음 예제는 HTML 문자열을 Document 객체로 구문 분석 한 후 텍스트를 가져 오는 메서드 사용을 보여줍니다.
통사론
Document document = Jsoup.parse(html);
Element link = document.select("a").first();
System.out.println("Text: " + link.text());
어디
document − 문서 객체는 HTML DOM을 나타냅니다.
Jsoup − 주어진 HTML 문자열을 분석하기위한 메인 클래스.
html − HTML 문자열.
link − Element 객체는 앵커 태그를 나타내는 html 노드 요소를 나타냅니다.
link.text() − text () 메서드는 요소 텍스트를 검색합니다.
기술
Element 객체는 dom 요소를 나타내며 dom 요소의 텍스트를 가져 오는 다양한 방법을 제공합니다.
예
C : /> jsoup에서 원하는 편집기를 사용하여 다음 Java 프로그램을 만듭니다.
JsoupTester.java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
public class JsoupTester {
public static void main(String[] args) {
String html = "<html><head><title>Sample Title</title></head>"
+ "<body>"
+ "<p>Sample Content</p>"
+ "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
+ "<h3><a>Sample</a><h3>"
+"</div>"
+"</body></html>";
Document document = Jsoup.parse(html);
//a with href
Element link = document.select("a").first();
System.out.println("Text: " + link.text());
}
}
결과 확인
다음을 사용하여 클래스 컴파일 javac 다음과 같이 컴파일러 :
C:\jsoup>javac JsoupTester.java
이제 JsoupTester를 실행하여 결과를 확인하십시오.
C:\jsoup>java JsoupTester
결과를 확인하십시오.
Text: Google