JavaSAXパーサー-概要

SAX(Simple API for XML)は、XMLドキュメント用のイベントベースのパーサーです。DOMパーサーとは異なり、SAXパーサーは解析ツリーを作成しません。SAXはXMLのストリーミングインターフェイスです。つまり、SAXを使用するアプリケーションは、要素と属性を処理しているXMLドキュメントに関するイベント通知を、ドキュメントの先頭から始まり、 ROOT要素。

  • XMLドキュメントを上から下に読み取り、整形式のXMLドキュメントを構成するトークンを認識します。

  • トークンは、ドキュメントに表示されるのと同じ順序で処理されます。

  • パーサーが発生したトークンの性質をアプリケーションプログラムに報告します。

  • アプリケーションプログラムは、パーサーに登録する必要のある「イベント」ハンドラーを提供します。

  • トークンが識別されると、ハンドラーのコールバックメソッドが関連情報とともに呼び出されます。

いつ使用しますか?

−の場合はSAXパーサーを使用する必要があります

  • XMLドキュメントは上から下に直線的に処理できます。

  • ドキュメントは深くネストされていません。

  • DOMツリーが大量のメモリを消費する非常に大きなXMLドキュメントを処理しています。一般的なDOM実装では、10バイトのメモリを使用して1バイトのXMLを表します。

  • 解決すべき問題は、XMLドキュメントの一部のみに関係します。

  • データはパーサーに表示されるとすぐに利用できるため、SAXはストリームを介して到着するXMLドキュメントに適しています。

SAXのデメリット

  • XMLドキュメントは順方向のみで処理されるため、ランダムアクセスはありません。

  • パーサーが確認したデータを追跡したり、アイテムの順序を変更したりする必要がある場合は、コードを記述してデータを自分で保存する必要があります。

ContentHandlerインターフェース

このインターフェイスは、SAXパーサーがXMLドキュメントのコンポーネントをアプリケーションプログラムに通知するために使用するコールバックメソッドを指定します。

  • void startDocument() −ドキュメントの冒頭で呼び出されます。

  • void endDocument() −ドキュメントの最後に呼び出されます。

  • void startElement(String uri, String localName, String qName, Attributes atts) −要素の先頭で呼び出されます。

  • void endElement(String uri, String localName,String qName) −要素の最後で呼び出されます。

  • void characters(char[] ch, int start, int length) −文字データが検出されたときに呼び出されます。

  • void ignorableWhitespace( char[] ch, int start, int length) − DTDが存在し、無視できる空白が検出された場合に呼び出されます。

  • void processingInstruction(String target, String data) −処理命令が認識されたときに呼び出されます。

  • void setDocumentLocator(Locator locator)) −ドキュメント内の位置を識別するために使用できるロケーターを提供します。

  • void skippedEntity(String name) −未解決のエンティティが検出されたときに呼び出されます。

  • void startPrefixMapping(String prefix, String uri) −新しい名前空間マッピングが定義されたときに呼び出されます。

  • void endPrefixMapping(String prefix) −名前空間定義がそのスコープを終了したときに呼び出されます。

属性インターフェース

このインターフェースは、要素に接続された属性を処理するためのメソッドを指定します。

  • int getLength() −属性の数を返します。

  • String getQName(int index)

  • String getValue(int index)

  • String getValue(String qname)