jsoup - Utilisation de la syntaxe de sélecteur
L'exemple suivant présente l'utilisation des méthodes de sélection après avoir analysé une chaîne HTML dans un objet Document. jsoup prend en charge les sélecteurs similaires aux sélecteurs CSS.
Syntaxe
Document document = Jsoup.parse(html);
Element sampleDiv = document.getElementById("sampleDiv");
Elements links = sampleDiv.getElementsByTag("a");
Où
document - l'objet document représente le DOM HTML.
Jsoup - classe principale pour analyser la chaîne HTML donnée.
html - Chaîne HTML.
sampleDiv - L'objet élément représente l'élément de nœud html identifié par l'identifiant "sampleDiv".
links - L'objet Elements représente les éléments de nœud multiples identifiés par la balise "a".
La description
La méthode document.select (expression) analyse l'expression de sélecteur CSS donnée pour sélectionner un élément dom html.
Exemple
Créez le programme java suivant en utilisant n'importe quel éditeur de votre choix, disons C: /> jsoup.
JsoupTester.java
import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;
public class JsoupTester {
public static void main(String[] args) {
String html = "<html><head><title>Sample Title</title></head>"
+ "<body>"
+ "<p>Sample Content</p>"
+ "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
+ "<h3><a>Sample</a><h3>"
+"</div>"
+ "<div id='imageDiv' class='header'><img name='google' src='google.png' />"
+ "<img name='yahoo' src='yahoo.jpg' />"
+"</div>"
+"</body></html>";
Document document = Jsoup.parse(html);
//a with href
Elements links = document.select("a[href]");
for (Element link : links) {
System.out.println("Href: " + link.attr("href"));
System.out.println("Text: " + link.text());
}
// img with src ending .png
Elements pngs = document.select("img[src$=.png]");
for (Element png : pngs) {
System.out.println("Name: " + png.attr("name"));
}
// div with class=header
Element headerDiv = document.select("div.header").first();
System.out.println("Id: " + headerDiv.id());
// direct a after h3
Elements sampleLinks = document.select("h3 > a");
for (Element link : sampleLinks) {
System.out.println("Text: " + link.text());
}
}
}
Vérifier le résultat
Compilez la classe en utilisant javac compilateur comme suit:
C:\jsoup>javac JsoupTester.java
Exécutez maintenant le JsoupTester pour voir le résultat.
C:\jsoup>java JsoupTester
Voyez le résultat.
Href: www.google.com
Text: Google
Name: google
Id: imageDiv
Text: Sample