jsoup - चयनकर्ता सिंटैक्स का उपयोग करना

उदाहरण के बाद एक डॉक्यूमेंट ऑब्जेक्ट में HTML स्ट्रिंग पार्स करने के बाद चयनकर्ता विधियों का उपयोग प्रदर्शित करेगा। jsoup CSS चयनकर्ताओं के समान चयनकर्ताओं का समर्थन करता है।

वाक्य - विन्यास

Document document = Jsoup.parse(html);
Element sampleDiv = document.getElementById("sampleDiv");
Elements links = sampleDiv.getElementsByTag("a");

कहाँ पे

  • document - डॉक्यूमेंट ऑब्जेक्ट HTML DOM को दर्शाता है।

  • Jsoup - दिए गए HTML स्ट्रिंग को पार्स करने के लिए मुख्य वर्ग।

  • html - HTML स्ट्रिंग।

  • sampleDiv - तत्व ऑब्जेक्ट आईडी "नमूनाडिव" द्वारा पहचाने गए HTML नोड तत्व का प्रतिनिधित्व करता है।

  • links - एलिमेंट्स ऑब्जेक्ट टैग "" ए "द्वारा पहचाने गए कई नोड तत्वों का प्रतिनिधित्व करता है।

विवरण

डॉक्युमेंट.सेलेक्ट (एक्सप्रेशन) विधि किसी HTML डोम एलिमेंट को चुनने के लिए दिए गए CSS चयनकर्ता एक्सप्रेशन को पार्स करता है।

उदाहरण

C: /> jsoup में अपनी पसंद के किसी भी संपादक का उपयोग करके निम्नलिखित जावा प्रोग्राम बनाएं।

JsoupTester.java

import org.jsoup.Jsoup;
import org.jsoup.nodes.Document;
import org.jsoup.nodes.Element;
import org.jsoup.select.Elements;

public class JsoupTester {
   public static void main(String[] args) {
   
      String html = "<html><head><title>Sample Title</title></head>"
         + "<body>"
         + "<p>Sample Content</p>"
         + "<div id='sampleDiv'><a href='www.google.com'>Google</a>"
         + "<h3><a>Sample</a><h3>"
         +"</div>"
         + "<div id='imageDiv' class='header'><img name='google' src='google.png' />"
         + "<img name='yahoo' src='yahoo.jpg' />"
         +"</div>"
         +"</body></html>";
      Document document = Jsoup.parse(html);

      //a with href
      Elements links = document.select("a[href]");

      for (Element link : links) {
         System.out.println("Href: " + link.attr("href"));
         System.out.println("Text: " + link.text());
      }

      // img with src ending .png
      Elements pngs = document.select("img[src$=.png]");

      for (Element png : pngs) {
         System.out.println("Name: " + png.attr("name"));
      }

      // div with class=header
      Element headerDiv = document.select("div.header").first();
      System.out.println("Id: " + headerDiv.id());
   
      // direct a after h3
      Elements sampleLinks = document.select("h3 > a"); 

      for (Element link : sampleLinks) {
         System.out.println("Text: " + link.text());
      }
   }
}

परिणाम सत्यापित करें

का उपयोग कर वर्ग संकलित करें javac संकलक निम्नानुसार है:

C:\jsoup>javac JsoupTester.java

अब परिणाम देखने के लिए JsoupTester चलाएं।

C:\jsoup>java JsoupTester

परिणाम देखें।

Href: www.google.com
Text: Google
Name: google
Id: imageDiv
Text: Sample