Java Stax Parser - ओवरव्यू
Stax एक जावा-आधारित API है जो XML दस्तावेज़ को उसी तरह से पार्स करता है जैसे SAX पार्सर करता है। लेकिन दो एपीआई के बीच दो प्रमुख अंतर हैं -
StAX एक PULL API है, जबकि SAX एक PUSH API है। इसका मतलब है कि Stax parser के मामले में, एक क्लाइंट एप्लिकेशन को जब भी जरूरत हो, XML से Stax parser को जानकारी प्राप्त करने के लिए पूछना होगा। लेकिन एसएएक्स पार्सर के मामले में, एक क्लाइंट एप्लिकेशन को जानकारी प्राप्त करने के लिए आवश्यक है जब एसएएक्स पार्सर क्लाइंट एप्लिकेशन को सूचित करता है कि जानकारी उपलब्ध है।
Stax API XML डॉक्यूमेंट लिखने के साथ-साथ पढ़ सकते हैं। SAX API का उपयोग करके, एक XML फ़ाइल को केवल पढ़ा जा सकता है।
पर्यावरण सेटअप
Stax parser का उपयोग करने के लिए, आपके पास अपने आवेदन के classpath में stax.jar होना चाहिए।
निम्नलिखित StAX एपीआई की विशेषताएं हैं -
ऊपर से नीचे तक एक XML दस्तावेज़ को पढ़ता है, एक अच्छी तरह से गठित XML दस्तावेज़ बनाने वाले टोकन को पहचानता है।
टोकन उसी क्रम में संसाधित किए जाते हैं जो वे दस्तावेज़ में दिखाई देते हैं।
अनुप्रयोग प्रोग्राम को टोकन की प्रकृति की रिपोर्ट करता है जो पार्सर का सामना करते हैं।
एप्लिकेशन प्रोग्राम एक "ईवेंट" रीडर प्रदान करता है जो एक पुनरावृत्त के रूप में कार्य करता है और आवश्यक जानकारी प्राप्त करने के लिए ईवेंट पर पुनरावृत्ति करता है। उपलब्ध एक और पाठक "कर्सर" है जो XML नोड्स के लिए एक सूचक के रूप में कार्य करता है।
जैसा कि घटनाओं की पहचान की जाती है, XML तत्वों को घटना ऑब्जेक्ट से पुनर्प्राप्त किया जा सकता है और इसे आगे संसाधित किया जा सकता है।
कब इस्तेमाल करें?
जब आपको Stax parser का उपयोग करना चाहिए -
आप ऊपर से नीचे तक एक रैखिक फैशन में एक्सएमएल दस्तावेज़ को संसाधित कर सकते हैं।
दस्तावेज़ को गहराई से नेस्टेड नहीं किया गया है।
आप एक बहुत बड़े XML दस्तावेज़ को संसाधित कर रहे हैं जिसका DOM ट्री बहुत अधिक मेमोरी का उपभोग करेगा। एक्सएमएल के एक बाइट का प्रतिनिधित्व करने के लिए विशिष्ट डोम कार्यान्वयन मेमोरी के दस बाइट्स का उपयोग करते हैं।
हल की जाने वाली समस्या में XML दस्तावेज़ का केवल एक हिस्सा शामिल है।
डेटा जैसे ही पार्सर द्वारा देखा जाता है, तो Stax एक XML दस्तावेज़ के लिए अच्छी तरह से काम करता है जो एक स्ट्रीम पर आता है।
SAX के नुकसान
XML दस्तावेज़ में हमारी कोई यादृच्छिक पहुँच नहीं है, क्योंकि यह केवल-अग्रेषित तरीके से संसाधित होता है।
यदि आपको उस डेटा का ट्रैक रखने की आवश्यकता है जिसे पार्सर ने देखा है या जहां पार्सर ने आइटमों के क्रम को बदल दिया है, तो आपको कोड लिखना होगा और डेटा को अपने आप स्टोर करना होगा।
XMLEventReader क्लास
यह वर्ग उन घटनाओं का पुनरावृत्ति प्रदान करता है जिनका उपयोग XML दस्तावेज़ को पार्स करते समय होने वाली घटनाओं पर पुनरावृति करने के लिए किया जा सकता है।
StartElement asStartElement() - एक तत्व के मूल्य और विशेषताओं को पुनः प्राप्त करने के लिए उपयोग किया जाता है।
EndElement asEndElement() - एक तत्व के अंत में कहा जाता है।
Characters asCharacters() - सीडीएटीए, व्हॉट्सएप आदि जैसे पात्रों को प्राप्त करने के लिए इस्तेमाल किया जा सकता है।
एक्सलेवेंटवर्टर क्लास
यह इंटरफ़ेस ईवेंट बनाने के लिए विधियाँ निर्दिष्ट करता है।
add(Event event) - XML वाले तत्वों को जोड़ें।
XMLStreamReader क्लास
यह वर्ग उन घटनाओं का पुनरावृत्ति प्रदान करता है जिनका उपयोग XML दस्तावेज़ को पार्स करते समय होने वाली घटनाओं पर पुनरावृति करने के लिए किया जा सकता है।
int next() - अगली घटना को पुनः प्राप्त करने के लिए उपयोग किया जाता है।
boolean hasNext() - आगे की घटनाओं की जाँच करने के लिए प्रयोग किया जाता है कि मौजूद है या नहीं।
String getText() - किसी तत्व का पाठ प्राप्त करने के लिए उपयोग किया जाता है।
String getLocalName() - एक तत्व का नाम पाने के लिए उपयोग किया जाता है।
XMLStreamWriter क्लास
यह इंटरफ़ेस ईवेंट बनाने के लिए विधियाँ निर्दिष्ट करता है।
writeStartElement(String localName) - दिए गए नाम का प्रारंभ तत्व जोड़ें।
writeEndElement(String localName) - दिए गए नाम का एक अंतिम तत्व जोड़ें।
writeAttribute(String localName, String value) - एक तत्व को विशेषताएँ लिखें।