jsoup - Utilisation de la syntaxe de sélecteur

L'exemple suivant présente l'utilisation des méthodes de sélection après avoir analysé une chaîne HTML dans un objet Document. jsoup prend en charge les sélecteurs similaires aux sélecteurs CSS.

Syntaxe

Document document = Jsoup.parse(html);
Element sampleDiv = document.getElementById("sampleDiv");
Elements links = sampleDiv.getElementsByTag("a");

  • document - l'objet document représente le DOM HTML.

  • Jsoup - classe principale pour analyser la chaîne HTML donnée.

  • html - Chaîne HTML.

  • sampleDiv - L'objet élément représente l'élément de nœud html identifié par l'identifiant "sampleDiv".

  • links - L'objet Elements représente les éléments de nœud multiples identifiés par la balise "a".

La description

La méthode document.select (expression) analyse l'expression de sélecteur CSS donnée pour sélectionner un élément dom html.

Exemple

Créez le programme java suivant en utilisant n'importe quel éditeur de votre choix, disons C: /> jsoup.

JsoupTester.java

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupTester {
   public static void main(String[] args) {
   
      String html = "<html><head><title>Sample Title</title></head>"
         + "<body>"
         + "<p>Sample Content</p>"
         + "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
         + "<h3><a>Sample</a><h3>"
         +"</div>"
         + "<div id='imageDiv' class='header'><img name='google' src='google.png' />"
         + "<img name='yahoo' src='yahoo.jpg' />"
         +"</div>"
         +"</body></html>";
      Document document = Jsoup.parse(html);

      //a with href
      Elements links = document.select("a[href]");

      for (Element link : links) {
         System.out.println("Href: " + link.attr("href"));
         System.out.println("Text: " + link.text());
      }

      // img with src ending .png
      Elements pngs = document.select("img[src$=.png]");

      for (Element png : pngs) {
         System.out.println("Name: " + png.attr("name"));
      }

      // div with class=header
      Element headerDiv = document.select("div.header").first();
      System.out.println("Id: " + headerDiv.id());
   
      // direct a after h3
      Elements sampleLinks = document.select("h3 > a"); 

      for (Element link : sampleLinks) {
         System.out.println("Text: " + link.text());
      }
   }
}

Vérifier le résultat

Compilez la classe en utilisant javac compilateur comme suit:

C:\jsoup>javac JsoupTester.java

Exécutez maintenant le JsoupTester pour voir le résultat.

C:\jsoup>java JsoupTester

Voyez le résultat.

Href: www.google.com
Text: Google
Name: google
Id: imageDiv
Text: Sample