本文目錄一覽:
如何用Python創建生成xml文檔文件的方法
1、內存數據產生
2、產生xml內存對象(也就是DOM樹)
3、產生根對象
4、往根對象里加數據
5、把xml內存對象寫到文件
python中xml具體怎麼用
pipinstalllxmlpython2.7.9自帶pip安裝工具。看下面圖片,圖中顯示本人電腦已經安裝好了。1.直接copy下載的模塊文件中已經有了模塊的文件,有些模塊只有一個文件,比如較早版本的BeautifulSoup,有些是一個文件夾,比如新版本BeautifulSoup就是一個叫做bs4的文件夾。把這些文件直接copy到你的python路徑下的/Lib/site-packages文件夾中,比如C:/Python27/Lib/site-packages。之後就可以在程序里直接引用了:importBeautifulSoup或者frombs4importBeautifulSoup這是根據你放置的文件位置不同而決定的。網上有人說直接放在Lib文件夾中就可以了。的確這樣也行,但Lib文件夾中都是自帶的模塊,看一下就會發現我們用過的random、re等模塊的代碼文件。而外部模塊一般放在site-packages文件夾中。2.setup.py很多模塊里都附帶了setup.py文件,有同學直接雙擊了,然後發現沒有用。它的使用方法是從命令行去到setup.py所在的路徑下,運行pythonsetup.pyinstall仔細看一下安裝時輸出的信息可以發現,在線學習這個命令做的事情其實也就是幫你把模塊的代碼copy到site-packages文件夾。3.setuptools使用setuptools可以直接根據模塊名稱來自動下載安裝,不需要自己再去尋找模塊的安裝文件。不過在使用之前,你得先安裝setuptools自身。windows平台的32位python,可以直接下載setuptools的exe文件安裝。
如何使用python生成xml
最近要用python生成一個xml格式的文件。因為有一些內容是中文,原來的xml文件中使用了CDATA 的部分。 而之前的python程序所用的庫中沒有 創建這個區域的方法。無奈研究了大半天。 最後用了 from lxml import etree 這個庫的方法。 這裡將可運行的 python程序分享出來。 供大家參考。 經過測試,這段代碼是可以直接運行生成xml格式內容的。
1 # -*- coding:utf-8 -*-
2 import sys
3 import time
4 import string
5
6 from lxml import etree
7
8
9 #設置默認字符集為UTF8 不然有些時候轉碼會出問題
10 default_encoding = ‘utf-8’
11 if sys.getdefaultencoding() != default_encoding:
12 reload(sys)
13 sys.setdefaultencoding(default_encoding)
14
15 def create_xml():
16
17 data = etree.Element(“data”)
18 #1 interface_version
19 interface_version_txt = ‘5’
20 interface_version = etree.SubElement(data, ‘interface_version’)
21 interface_version.text = interface_version_txt
22 #2 site
23 site_txt = ”
24 site = etree.SubElement(data, ‘site’)
25 site.text = site_txt
26 #3 lastmod
27 lastmod_txt = time.strftime(‘%Y-%m-%d’, time.localtime())
28 lastmod = etree.SubElement(data, ‘lastmod’)
29 lastmod.text = lastmod_txt
30 #5 app
31 app = etree.SubElement(data, ‘app’)
32 #6 title
33 title_txt = u’%s’ % ‘真心話大冒險’
34 title_txt = etree.CDATA(title_txt)
35 title = etree.SubElement(app, ‘title’)
36 title.text = title_txt
37 #7 appid
38 appid = etree.SubElement(app, ‘appid’)
39 appid.text = ‘%s’ % ‘222’
40
41 dataxml = etree.tostring(data, pretty_print=True, encoding=”UTF-8″, method=”xml”, xml_declaration=True, standalone=None)
42 print dataxml
43
44
47 if __name__ == ‘__main__’:
48 create_xml()
用python怎麼操作xml文件內容
一、什麼是xml?
xml即可擴展標記語言,它可以用來標記數據、定義數據類型,是一種允許用戶對自己的標記語言進行定義的源語言。
abc.xml
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
Ok ,從結構上,它很像我們常見的HTML超文本標記語言。但他們被設計的目的是不同的,超文本標記語言被設計用來顯示數據,其焦點是數據的外觀。它被設計用來傳輸和存儲數據,其焦點是數據的內容。
那麼它有如下特徵:
首先,它是有標籤對組成,aa/aa
標籤可以有屬性:aa id=’123’/aa
標籤對可以嵌入數據:aaabc/aa
標籤可以嵌入子標籤(具有層級關係):
二、獲得標籤屬性
那麼,下面來介紹如何用python來讀取這種類型的文件。
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
print root.nodeName
print root.nodeValue
print root.nodeType
print root.ELEMENT_NODE
mxl.dom.minidom 模塊被用來處理xml文件,所以要先引入。
xml.dom.minidom.parse() 用於打開一個xml文件,並將這個文件對象dom變數。
documentElement 用於得到dom對象的文檔元素,並把獲得的對象給root
每一個結點都有它的nodeName,nodeValue,nodeType屬性。
nodeName為結點名字。
nodeValue是結點的值,只對文本結點有效。
nodeType是結點的類型。catalog是ELEMENT_NODE類型
現在有以下幾種:
‘ATTRIBUTE_NODE’
‘CDATA_SECTION_NODE’
‘COMMENT_NODE’
‘DOCUMENT_FRAGMENT_NODE’
‘DOCUMENT_NODE’
‘DOCUMENT_TYPE_NODE’
‘ELEMENT_NODE’
‘ENTITY_NODE’
‘ENTITY_REFERENCE_NODE’
‘NOTATION_NODE’
‘PROCESSING_INSTRUCTION_NODE’
‘TEXT_NODE’
三、獲得子標籤
現在要獲得catalog的子標籤以的標籤name
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
對於知道元素名字的子元素,可以使用getElementsByTagName方法獲取:
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
bb = root.getElementsByTagName(‘maxid’)
b= bb[0]
print b.nodeName
bb = root.getElementsByTagName(‘login’)
b= bb[0]
print b.nodeName
如何區分相同標籤名字的標籤:
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
caption和item標籤不止一個如何區分?
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
bb = root.getElementsByTagName(‘caption’)
b= bb[2]
print b.nodeName
bb = root.getElementsByTagName(‘item’)
b= bb[1]
print b.nodeName
root.getElementsByTagName(‘caption’) 獲得的是標籤為caption 一組標籤,b[0]表示一組標籤中的第一個;b[2] ,表示這一組標籤中的第三個。
四、獲得標籤屬性值
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
login和item標籤是有屬性的,如何獲得他們的屬性?
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
itemlist = root.getElementsByTagName(‘login’)
item = itemlist[0]
un=item.getAttribute(“username”)
print un
pd=item.getAttribute(“passwd”)
print pd
ii = root.getElementsByTagName(‘item’)
i1 = ii[0]
i=i1.getAttribute(“id”)
print i
i2 = ii[1]
i=i2.getAttribute(“id”)
print i
getAttribute方法可以獲得元素的屬性所對應的值。
五、獲得標籤對之間的數據
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
caption標籤對之間是有數據的,如何獲得這些數據?
獲得標籤對之間的數據有多種方法,
方法一:
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
cc=dom.getElementsByTagName(‘caption’)
c1=cc[0]
print c1.firstChild.data
c2=cc[1]
print c2.firstChild.data
c3=cc[2]
print c3.firstChild.data
firstChild 屬性返回被選節點的第一個子節點,.data表示獲取該節點人數據。
方法二:
複製代碼代碼如下:
#coding=utf-8
from xml.etree import ElementTree as ET
per=ET.parse(‘abc.xml’)
p=per.findall(‘./login/item’)
for oneper in p:
for child in oneper.getchildren():
print child.tag,’:’,child.text
p=per.findall(‘./item’)
for oneper in p:
for child in oneper.getchildren():
print child.tag,’:’,child.text
方法二有點複雜,所引用模塊也與前面的不一樣,findall用於指定在哪一級標籤下開始遍歷。
getchildren方法按照文檔順序返回所有子標籤。並輸出標籤名(child.tag)和標籤的數據(child.text)
其實,方法二的作用不在於此,它核心功能是可以遍歷某一級標籤下的所有子標籤。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/247442.html