java解析xml有哪幾種方法(xml解析的三種方式)

本文目錄一覽:

java的xml的解析方式有什麼,他們的解析流程是怎麼樣的,有什麼區別

答:4種。(或者說是兩種,因為JDOM和DOM4J是DOM的兩個特殊情況)

1.SAX解析

解析方式是事件驅動機制!

SAX解析器,逐行讀取XML文件解析,每當解析到一個標籤的開始/結束/內容/屬性時,觸發事件。

可以在這些事件發生時,編寫程序進行相應的處理。

優點:

分析能夠立即開始,而不是等待所有的數據被處理。

逐行載入,節省內存,有助於解析大於系統內存的文檔。

有時不必解析整個文檔,它可以在某個條件得到滿足時停止解析。

缺點:

1.單向解析,無法定位文檔層次,無法同時訪問同一個文檔的不同部分數據(因為逐行解析,當解析第n行時,第n-1行)已經被釋放了,無法再對其進行操作)。

2. 無法得知事件發生時元素的層次, 只能自己維護節點的父/子關係。

3. 只讀解析方式, 無法修改XML文檔的內容。

2. DOM解析

是用與平台和語言無關的方式表示XML文檔的官方W3C標準,分析該結構通常需要載入整個 文檔和內存中建立文檔樹模型。程序員可以通過操作文檔樹, 來完成數據的獲取 修改 刪除等。

優點:

文檔在內存中載入, 允許對數據和結構做出更改。訪問是雙向的,可以在任何時候在樹中雙向解析數據。

缺點:

文檔全部載入在內存中 , 消耗資源大。

3. JDOM解析

目的是成為Java特定文檔模型,它簡化與XML的交互並且比使用DOM實現更快。由於是第一 個Java特定模型,JDOM一直得到大力推廣和促進。

JDOM文檔聲明其目的是「使用20%(或更少)的精力解決80%(或更多)Java/XML問題」 (根據學習曲線假定為20%)

優點:

使用具體類而不是介面,簡化了DOM的API。

大量使用了Java集合類,方便了Java開發人員。

缺點:

沒有較好的靈活性。

性能不是那麼優異。

4. DOM4J解析

它是JDOM的一種智能分支。它合併了許多超出基本XML文檔表示的功能,包括集成的XPath 支持、XML Schema支持以及用於大文檔或流化文檔的基於事件的處理。它還提供了構建文檔表示的選項, DOM4J是一個非常優秀的Java XML API,具有性能優異、功能強大和極端易用使用的特點,同時它也是一 個開放源代碼的軟體。如今你可以看到越來越多的Java軟體都在使用DOM4J來讀寫XML。

目前許多開源項目中大量採用DOM4J , 例如:Hibernate。

在java中解析xml有哪幾種方法

(1)DOM解析

DOM是html和xml的應用程序介面(API),以層次結構(類似於樹型)來組織節點和信息片段,映射XML文檔的結構,允許獲取

和操作文檔的任意部分,是W3C的官方標準

【優點】

①允許應用程序對數據和結構做出更改。

②訪問是雙向的,可以在任何時候在樹中上下導航,獲取和操作任意部分的數據。

【缺點】

①通常需要載入整個XML文檔來構造層次結構,消耗資源大。

【解析詳解】

①構建Document對象:

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

DocumentBuilder db = bdf.newDocumentBuilder();

InputStream is = Thread.currentThread().getContextClassLoader().getResourceAsStream(xml文件);

Document doc = bd.parse(is);

②遍歷DOM對象

Document: XML文檔對象,由解析器獲取

NodeList: 節點數組

Node: 節點(包括element、#text)

Element: 元素,可用於獲取屬性參數

(2)SAX(Simple API for XML)解析

流模型中的”推”模型分析方式。通過事件驅動,每發現一個節點就引發一個事件,事件推給事件處理器,通過回調方法

完成解析工作,解析XML文檔的邏輯需要應用程序完成

【優勢】

①不需要等待所有數據都被處理,分析就能立即開始。

②只在讀取數據時檢查數據,不需要保存在內存中。

③可以在某個條件得到滿足時停止解析,不必解析整個文檔。

④效率和性能較高,能解析大於系統內存的文檔。

【缺點】

①需要應用程序自己負責TAG的處理邏輯(例如維護父/子關係等),文檔越複雜程序就越複雜。

②單嚮導航,無法定位文檔層次,很難同時訪問同一文檔的不同部分數據,不支持XPath。

【原理】

簡單的說就是對文檔進行順序掃描,當掃描到文檔(document)開始與結束、元素(element)開始與結束時通知事件

處理函數(回調函數),進行相應處理,直到文檔結束

【事件處理器類型】

①訪問XML DTD:DTDHandler

②低級訪問解析錯誤:ErrorHandler

③訪問文檔內容:ContextHandler

【DefaultHandler類】

SAX事件處理程序的默認基類,實現了DTDHandler、ErrorHandler、ContextHandler和EntityResolver介面,通常

做法是,繼承該基類,重寫需要的方法,如startDocument()

【創建SAX解析器】

SAXParserFactory saxf = SAXParserFactory.newInstance();

SAXParser sax = saxf.newSAXParser();

註:關於遍歷

①深度優先遍歷(Depthi-First Traserval)

②廣度優先遍歷(Width-First Traserval)

(3)JDOM(Java-based Document Object Model)

Java特定的文檔對象模型。自身不包含解析器,使用SAX

【優點】

①使用具體類而不是介面,簡化了DOM的API。

②大量使用了Java集合類,方便了Java開發人員。

【缺點】

①沒有較好的靈活性。

②性能較差。

(4)DOM4J(Document Object Model for Java)

簡單易用,採用Java集合框架,並完全支持DOM、SAX和JAXP

【優點】

①大量使用了Java集合類,方便Java開發人員,同時提供一些提高性能的替代方法。

②支持XPath。

③有很好的性能。

【缺點】

①大量使用了介面,API較為複雜。

(5)StAX(Streaming API for XML)

流模型中的拉模型分析方式。提供基於指針和基於迭代器兩種方式的支持,JDK1.6新特性

【和推式解析相比的優點】

①在拉式解析中,事件是由解析應用產生的,因此拉式解析中向客戶端提供的是解析規則,而不是解析器。

②同推式解析相比,拉式解析的代碼更簡單,而且不用那麼多庫。

③拉式解析客戶端能夠一次讀取多個XML文件。

④拉式解析允許你過濾XML文件和跳過解析事件。

【簡介】

StAX API的實現是使用了Java Web服務開發(JWSDP)1.6,並結合了Sun Java流式XML分析器(SJSXP)-它位於

javax.xml.stream包中。XMLStreamReader介面用於分析一個XML文檔,而XMLStreamWriter介面用於生成一個

XML文檔。XMLEventReader負責使用一個對象事件迭代子分析XML事件-這與XMLStreamReader所使用的游標機制

形成對照。

java解析xml有幾種方法

DOM(Document Object Model)解析

優點

允許應用程序對數據和結構做出更改

訪問是雙向的,可以在任何時候在樹中上、下導航獲取、操作任意部分的數據

缺點

解析XML文檔的需要載入整個文檔來構造層次結構,消耗內存資源大。

應用範圍

遍歷能力強,常應用於XML文檔需要頻繁改變的服務中。

解析步驟

創建一個 DocumentBuilderFactory 對象

創建一個 DocumentBuilder 對象

通過 DocumentBuilder 的 parse() 方法載入 XML 到當前工程目錄下

通過 getElementsByTagName() 方法獲取所有 XML 所有節點的集合

遍歷所有節點

通過 item() 方法獲取某個節點的屬性

通過 getNodeName() 和 getNodeValue() 方法獲取屬性名和屬性值

通過 getChildNodes() 方法獲取子節點,並遍歷所有子節點

通過 getNodeName() 和 getTextContent() 方法獲取子節點名稱和子節點值

package Paint;

import java.io.IOException;

import javax.xml.parsers.DocumentBuilder;

import javax.xml.parsers.DocumentBuilderFactory;

import javax.xml.parsers.ParserConfigurationException;

import org.w3c.dom.Document;

import org.w3c.dom.NamedNodeMap;

import org.w3c.dom.Node;

import org.w3c.dom.NodeList;

import org.xml.sax.SAXException;

public class DOMTest {

public static void main(String[] args) {

DocumentBuilderFactory dbf = DocumentBuilderFactory.newInstance();

try {

DocumentBuilder db = dbf.newDocumentBuilder();

Document document = db.parse(“./src/Paint/hello.xml”);

NodeList bookList = document.getElementsByTagName(“book”); //節點集

int bookCnt = bookList.getLength();

System.err.println(“一共獲取到” + bookCnt +”本書”);

for(int i=0; i Node book = bookList.item(i);

NamedNodeMap attrs = book.getAttributes();

for(int j=0; j Node attr = attrs.item(j);

System.err.println(attr.getNodeName()+”—“+attr.getNodeValue());//id

}

NodeList childNodes = book.getChildNodes();

for(int k=0; k if(childNodes.item(k).getNodeType() == Node.ELEMENT_NODE){

System.out.println(childNodes.item(k).getNodeName()+”—” + childNodes.item(k).getTextContent());

}

}

}

} catch (ParserConfigurationException e) {

e.printStackTrace();

} catch (SAXException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

}

}

SAX(Simple API for XML)解析

優點

不需要等待所有的數據被處理,解析就可以開始

只在讀取數據時檢查數據,不需要保存在內存中

可以在某一個條件滿足時停止解析,不必要解析整個文檔

效率和性能較高,能解析大於系統內存的文檔

缺點

解析邏輯複雜,需要應用層自己負責邏輯處理,文檔越複雜程序越複雜

單嚮導航,無法定位文檔層次,很難同時同時訪問同一文檔的不同部分數據,不支持 XPath

解析步驟

獲取一個 SAXParserFactory 的實例

通過 factory() 獲取 SAXParser 實例

創建一個 handler() 對象

通過 parser 的 parse() 方法來解析 XML

SAXTest.java

package Paint;

import java.io.IOException;

import javax.xml.parsers.ParserConfigurationException;

import javax.xml.parsers.SAXParser;

import javax.xml.parsers.SAXParserFactory;

import org.xml.sax.SAXException;

public class SAXTest {

public static void main(String[] args) {

// 獲取實例

SAXParserFactory factory = SAXParserFactory.newInstance();

try {

SAXParser parser = factory.newSAXParser();

SAXParserHandler handler = new SAXParserHandler();

parser.parse(“./src/Paint/hello.xml”, handler);

System.err.println(“共有”+ handler.getBookList().size()+ “本書”);

for(Book book : handler.getBookList()){

System.out.println(book.getName());

System.out.println(“id=” + book.getId());

System.out.println(book.getAuthor());

System.out.println(book.getYear());

System.out.println(book.getPrice());

System.out.println(book.getLanguage());

}

} catch (ParserConfigurationException e) {

e.printStackTrace();

} catch (SAXException e) {

e.printStackTrace();

} catch (IOException e) {

e.printStackTrace();

}

}

}

SAXParserHandler.java

package Paint;

import java.util.ArrayList;

import org.xml.sax.Attributes;

import org.xml.sax.SAXException;

import org.xml.sax.helpers.DefaultHandler;

public class SAXParserHandler extends DefaultHandler {

String value = null;

Book book = null;

private ArrayList bookList = new ArrayList();

public ArrayList getBookList() {

return bookList;

}

/*

* XML 解析開始

*/

public void startDocument() throws SAXException {

super.startDocument();

System.out.println(“xml 解析開始”);

}

/*

* XML 解析結束

*/

public void endDocument() throws SAXException {

super.endDocument();

System.out.println(“xml 解析結束”);

}

/*

* 解析 XML 元素開始

*/

public void startElement(String uri, String localName, String qName,

Attributes attributes) throws SAXException {

super.startElement(uri, localName, qName, attributes);

if(qName.equals(“book”)){

book = new Book();

for(int i=0; i System.out.println(attributes.getQName(i)+”—“+attributes.getValue(i));

if(attributes.getQName(i).equals(“id”)){

book.setId(attributes.getValue(i));

}

}

}else if(!qName.equals(“bookstore”)){

System.out.print(“節點名:”+ qName + “—“);

}

}

/*

*解析 XML 元素結束

*/

public void endElement(String uri, String localName, String qName)

throws SAXException {

super.endElement(uri, localName, qName);

if(qName.equals(“book”)){

bookList.add(book);

book = null;

}

else if(qName.equals(“name”)){

book.setName(value);

}else if(qName.equals(“year”)){

book.setYear(value);

}else if(qName.equals(“author”)){

book.setAuthor(value);

}else if(qName.equals(“price”)){

book.setPrice(value);

}else if(qName.equals(“language”)){

book.setLanguage(value);

}

}

public void characters(char[] ch, int start, int length)

throws SAXException {

super.characters(ch, start, length);

// 獲取節點值數組

value = new String(ch, start, length);

if(!value.trim().equals(“”)){

System.out.println(“節點值:”+value);

}

}

}

java解析xml的幾種方式哪種最好?

在java中解析xml有哪幾種方法?

1、JDOM生成和解析XML

為減少DOM、SAX的編碼量,出現了JDOM

優點:20-80原則,極大減少了代碼量。

使用場合:要實現的功能簡單,如解析、創建等,但在底層,JDOM還是使用SAX(最常用)、DOM、Xanan文檔。

2、SAX生成和解析XML文檔

為解決DOM的問題,出現了SAX,SAX

事件驅動。當解析器發現元素開始、元素結束、文本、文檔的開始或結束等時發送事件,程序員編寫響應這些事件的代碼,保存數據。

優點:不用事先調入整個文檔,佔用資源少。SAX解析器代碼比DOM解析器代碼小,適於Applet下載。

缺點:不是持久的,事件過後若沒保存數據,那麼數據就丟了。無狀態性,從事件中只能得到文本,但不知該文本屬於哪個元素。

使用場合:Applet。只需XML文檔的少量內容,很少回頭訪問,機器內存少。

3、DOM生成和解析XML文檔

為XML文檔的已解析版本定義了一組介面。解析器讀入整個文檔,然後構建一個駐留內存的樹結構,然後代碼就可以使用 DOM 介面來操作這個樹結構。

優點:整個文檔樹在內存中,便於操作,支持刪除、修改、重新排列等多種功能。

缺點:將整個文檔調入內存(包括無用的節點),浪費時間和空間。

使用場合:一旦解析了文檔還需多次訪問這些數據,硬體資源充足(內存、CPU)。

原創文章,作者:RFRCK,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/130757.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
RFRCK的頭像RFRCK
上一篇 2024-10-03 23:29
下一篇 2024-10-03 23:42

相關推薦

  • Java JsonPath 效率優化指南

    本篇文章將深入探討Java JsonPath的效率問題,並提供一些優化方案。 一、JsonPath 簡介 JsonPath是一個可用於從JSON數據中獲取信息的庫。它提供了一種DS…

    編程 2025-04-29
  • java client.getacsresponse 編譯報錯解決方法

    java client.getacsresponse 編譯報錯是Java編程過程中常見的錯誤,常見的原因是代碼的語法錯誤、類庫依賴問題和編譯環境的配置問題。下面將從多個方面進行分析…

    編程 2025-04-29
  • Java騰訊雲音視頻對接

    本文旨在從多個方面詳細闡述Java騰訊雲音視頻對接,提供完整的代碼示例。 一、騰訊雲音視頻介紹 騰訊雲音視頻服務(Cloud Tencent Real-Time Communica…

    編程 2025-04-29
  • Java Bean載入過程

    Java Bean載入過程涉及到類載入器、反射機制和Java虛擬機的執行過程。在本文中,將從這三個方面詳細闡述Java Bean載入的過程。 一、類載入器 類載入器是Java虛擬機…

    編程 2025-04-29
  • Java Milvus SearchParam withoutFields用法介紹

    本文將詳細介紹Java Milvus SearchParam withoutFields的相關知識和用法。 一、什麼是Java Milvus SearchParam without…

    編程 2025-04-29
  • Java 8中某一周的周一

    Java 8是Java語言中的一個版本,於2014年3月18日發布。本文將從多個方面對Java 8中某一周的周一進行詳細的闡述。 一、數組處理 Java 8新特性之一是Stream…

    編程 2025-04-29
  • Java判斷字元串是否存在多個

    本文將從以下幾個方面詳細闡述如何使用Java判斷一個字元串中是否存在多個指定字元: 一、字元串遍歷 字元串是Java編程中非常重要的一種數據類型。要判斷字元串中是否存在多個指定字元…

    編程 2025-04-29
  • VSCode為什麼無法運行Java

    解答:VSCode無法運行Java是因為默認情況下,VSCode並沒有集成Java運行環境,需要手動添加Java運行環境或安裝相關插件才能實現Java代碼的編寫、調試和運行。 一、…

    編程 2025-04-29
  • Java任務下發回滾系統的設計與實現

    本文將介紹一個Java任務下發回滾系統的設計與實現。該系統可以用於執行複雜的任務,包括可回滾的任務,及時恢復任務失敗前的狀態。系統使用Java語言進行開發,可以支持多種類型的任務。…

    編程 2025-04-29
  • Java 8 Group By 會影響排序嗎?

    是的,Java 8中的Group By會對排序產生影響。本文將從多個方面探討Group By對排序的影響。 一、Group By的概述 Group By是SQL中的一種常見操作,它…

    編程 2025-04-29

發表回復

登錄後才能評論