jsoup - Extraire du texte

L'exemple suivant présentera l'utilisation de méthodes pour obtenir du texte après l'analyse d'une chaîne HTML dans un objet Document.

Syntaxe

Document document = Jsoup.parse(html);
Element link = document.select("a").first();     
System.out.println("Text: " + link.text());

  • document - l'objet document représente le DOM HTML.

  • Jsoup - classe principale pour analyser la chaîne HTML donnée.

  • html - Chaîne HTML.

  • link - L'objet Element représente l'élément de nœud html représentant la balise d'ancrage.

  • link.text() - La méthode text () récupère le texte de l'élément.

La description

L'objet Element représente un élément dom et fournit diverses méthodes pour obtenir le texte d'un élément dom.

Exemple

Créez le programme java suivant en utilisant n'importe quel éditeur de votre choix, disons C: /> jsoup.

JsoupTester.java

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;

public class JsoupTester {
   public static void main(String[] args) {
   
      String html = "<html><head><title>Sample Title</title></head>"
         + "<body>"
         + "<p>Sample Content</p>"
         + "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
         + "<h3><a>Sample</a><h3>"
         +"</div>"
         +"</body></html>";
      Document document = Jsoup.parse(html);

      //a with href
      Element link = document.select("a").first();         

      System.out.println("Text: " + link.text());
   }
}

Vérifier le résultat

Compilez la classe en utilisant javac compilateur comme suit:

C:\jsoup>javac JsoupTester.java

Exécutez maintenant le JsoupTester pour voir le résultat.

C:\jsoup>java JsoupTester

Voyez le résultat.

Text: Google