python操作xml創建網站的簡單介紹

本文目錄一覽：

1、如何用Python創建生成xml文檔文件的方法
2、python中xml具體怎麼用
3、如何使用python生成xml
4、用python怎麼操作xml文件內容

如何用Python創建生成xml文檔文件的方法

1、內存數據產生

2、產生xml內存對象（也就是DOM樹）

3、產生根對象

4、往根對象里加數據

5、把xml內存對象寫到文件

python中xml具體怎麼用

pipinstalllxmlpython2.7.9自帶pip安裝工具。看下面圖片,圖中顯示本人電腦已經安裝好了。1.直接copy下載的模塊文件中已經有了模塊的文件，有些模塊只有一個文件，比如較早版本的BeautifulSoup，有些是一個文件夾，比如新版本BeautifulSoup就是一個叫做bs4的文件夾。把這些文件直接copy到你的python路徑下的/Lib/site-packages文件夾中，比如C:/Python27/Lib/site-packages。之後就可以在程序里直接引用了：importBeautifulSoup或者frombs4importBeautifulSoup這是根據你放置的文件位置不同而決定的。網上有人說直接放在Lib文件夾中就可以了。的確這樣也行，但Lib文件夾中都是自帶的模塊，看一下就會發現我們用過的random、re等模塊的代碼文件。而外部模塊一般放在site-packages文件夾中。2.setup.py很多模塊里都附帶了setup.py文件，有同學直接雙擊了，然後發現沒有用。它的使用方法是從命令行去到setup.py所在的路徑下，運行pythonsetup.pyinstall仔細看一下安裝時輸出的信息可以發現，在線學習這個命令做的事情其實也就是幫你把模塊的代碼copy到site-packages文件夾。3.setuptools使用setuptools可以直接根據模塊名稱來自動下載安裝，不需要自己再去尋找模塊的安裝文件。不過在使用之前，你得先安裝setuptools自身。windows平台的32位python，可以直接下載setuptools的exe文件安裝。

如何使用python生成xml

最近要用python生成一個xml格式的文件。因為有一些內容是中文，原來的xml文件中使用了CDATA 的部分。而之前的python程序所用的庫中沒有創建這個區域的方法。無奈研究了大半天。最後用了 from lxml import etree 這個庫的方法。這裡將可運行的 python程序分享出來。供大家參考。經過測試，這段代碼是可以直接運行生成xml格式內容的。

1 # -*- coding:utf-8 -*-

2 import sys

3 import time

4 import string

6 from lxml import etree

9 #設置默認字符集為UTF8 不然有些時候轉碼會出問題

10 default_encoding = ‘utf-8’

11 if sys.getdefaultencoding() != default_encoding:

12 reload(sys)

13 sys.setdefaultencoding(default_encoding)

15 def create_xml():

17 data = etree.Element(“data”)

18 #1 interface_version

19 interface_version_txt = ‘5’

20 interface_version = etree.SubElement(data, ‘interface_version’)

21 interface_version.text = interface_version_txt

22 #2 site

23 site_txt = ”

24 site = etree.SubElement(data, ‘site’)

25 site.text = site_txt

26 #3 lastmod

27 lastmod_txt = time.strftime(‘%Y-%m-%d’, time.localtime())

28 lastmod = etree.SubElement(data, ‘lastmod’)

29 lastmod.text = lastmod_txt

30 #5 app

31 app = etree.SubElement(data, ‘app’)

32 #6 title

33 title_txt = u’%s’ % ‘真心話大冒險’

34 title_txt = etree.CDATA(title_txt)

35 title = etree.SubElement(app, ‘title’)

36 title.text = title_txt

37 #7 appid

38 appid = etree.SubElement(app, ‘appid’)

39 appid.text = ‘%s’ % ‘222’

41 dataxml = etree.tostring(data, pretty_print=True, encoding=”UTF-8″, method=”xml”, xml_declaration=True, standalone=None)

42 print dataxml

47 if __name__ == ‘__main__’:

48 create_xml()

用python怎麼操作xml文件內容

一、什麼是xml？

xml即可擴展標記語言，它可以用來標記數據、定義數據類型，是一種允許用戶對自己的標記語言進行定義的源語言。

abc.xml

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

Ok ,從結構上，它很像我們常見的HTML超文本標記語言。但他們被設計的目的是不同的，超文本標記語言被設計用來顯示數據，其焦點是數據的外觀。它被設計用來傳輸和存儲數據，其焦點是數據的內容。

那麼它有如下特徵：

首先，它是有標籤對組成，aa/aa

標籤可以有屬性：aa id=’123’/aa

標籤對可以嵌入數據：aaabc/aa

標籤可以嵌入子標籤（具有層級關係）：

二、獲得標籤屬性

那麼，下面來介紹如何用python來讀取這種類型的文件。

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

print root.nodeName

print root.nodeValue

print root.nodeType

print root.ELEMENT_NODE

mxl.dom.minidom 模塊被用來處理xml文件，所以要先引入。

xml.dom.minidom.parse() 用於打開一個xml文件，並將這個文件對象dom變數。

documentElement 用於得到dom對象的文檔元素，並把獲得的對象給root

每一個結點都有它的nodeName，nodeValue，nodeType屬性。

nodeName為結點名字。

nodeValue是結點的值，只對文本結點有效。

nodeType是結點的類型。catalog是ELEMENT_NODE類型

現在有以下幾種：

‘ATTRIBUTE_NODE’

‘CDATA_SECTION_NODE’

‘COMMENT_NODE’

‘DOCUMENT_FRAGMENT_NODE’

‘DOCUMENT_NODE’

‘DOCUMENT_TYPE_NODE’

‘ELEMENT_NODE’

‘ENTITY_NODE’

‘ENTITY_REFERENCE_NODE’

‘NOTATION_NODE’

‘PROCESSING_INSTRUCTION_NODE’

‘TEXT_NODE’

三、獲得子標籤

現在要獲得catalog的子標籤以的標籤name

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

對於知道元素名字的子元素，可以使用getElementsByTagName方法獲取：

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

bb = root.getElementsByTagName(‘maxid’)

b= bb[0]

print b.nodeName

bb = root.getElementsByTagName(‘login’)

b= bb[0]

print b.nodeName

如何區分相同標籤名字的標籤：

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

caption和item標籤不止一個如何區分？

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

bb = root.getElementsByTagName(‘caption’)

b= bb[2]

print b.nodeName

bb = root.getElementsByTagName(‘item’)

b= bb[1]

print b.nodeName

root.getElementsByTagName(‘caption’) 獲得的是標籤為caption 一組標籤，b[0]表示一組標籤中的第一個；b[2] ，表示這一組標籤中的第三個。

四、獲得標籤屬性值

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

login和item標籤是有屬性的，如何獲得他們的屬性？

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

itemlist = root.getElementsByTagName(‘login’)

item = itemlist[0]

un=item.getAttribute(“username”)

print un

pd=item.getAttribute(“passwd”)

print pd

ii = root.getElementsByTagName(‘item’)

i1 = ii[0]

i=i1.getAttribute(“id”)

print i

i2 = ii[1]

i=i2.getAttribute(“id”)

print i

getAttribute方法可以獲得元素的屬性所對應的值。

五、獲得標籤對之間的數據

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

caption標籤對之間是有數據的，如何獲得這些數據？

獲得標籤對之間的數據有多種方法，

方法一：

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

cc=dom.getElementsByTagName(‘caption’)

c1=cc[0]

print c1.firstChild.data

c2=cc[1]

print c2.firstChild.data

c3=cc[2]

print c3.firstChild.data

firstChild 屬性返回被選節點的第一個子節點，.data表示獲取該節點人數據。

方法二：

複製代碼代碼如下:

#coding=utf-8

from xml.etree import ElementTree as ET

per=ET.parse(‘abc.xml’)

p=per.findall(‘./login/item’)

for oneper in p:

for child in oneper.getchildren():

print child.tag,’:’,child.text

p=per.findall(‘./item’)

for oneper in p:

for child in oneper.getchildren():

print child.tag,’:’,child.text

方法二有點複雜，所引用模塊也與前面的不一樣，findall用於指定在哪一級標籤下開始遍歷。

getchildren方法按照文檔順序返回所有子標籤。並輸出標籤名（child.tag）和標籤的數據（child.text）

其實，方法二的作用不在於此，它核心功能是可以遍歷某一級標籤下的所有子標籤。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/247442.html

python操作xml創建網站的簡單介紹

本文目錄一覽：

如何用Python創建生成xml文檔文件的方法

python中xml具體怎麼用

如何使用python生成xml

用python怎麼操作xml文件內容

相關推薦

發表回復