本文目錄一覽:
- 1、python 怎麼修改xml文件內容
- 2、求大神指教:如何用python讀取xml文件中指定標籤的文檔內容並將其修改?最好寫下詳細代碼,非常感謝哈!
- 3、用python怎麼操作xml文件內容
- 4、python解析xml,包含中文,gb2312編碼。修改xml後重新寫入xml有些內容怎麼變了? 我的步驟如下:
- 5、python 替換xml中的一行或者兩行
- 6、python操作xml文件問題
python 怎麼修改xml文件內容
類似於:
#!/usr/bin/evn python
#coding:utf-8
try:
import xml.etree.cElementTree as ET
except ImportError:
import xml.etree.ElementTree as ET
import sys
try:
tree = ET.parse(“country.xml”) #打開xml文檔
#root = ET.fromstring(country_string) #從字元串傳遞xml
root = tree.getroot() #獲得root節點
except Exception, e:
print “Error:cannot parse file:country.xml.”
sys.exit(1)
print root.tag, “—“, root.attrib
for child in root:
print child.tag, “—“, child.attrib
print “*”*10
print root[0][1].text #通過下標訪問
print root[0].tag, root[0].text
print “*”*10
for country in root.findall(‘country’): #找到root節點下的所有country節點
rank = country.find(‘rank’).text #子節點下節點rank的值
name = country.get(‘name’) #子節點下屬性name的值
print name, rank
#修改xml文件
for country in root.findall(‘country’):
rank = int(country.find(‘rank’).text)
if rank 50:
root.remove(country)
tree.write(‘output.xml’)
給你推薦一篇文章看看吧:
求大神指教:如何用python讀取xml文件中指定標籤的文檔內容並將其修改?最好寫下詳細代碼,非常感謝哈!
使用python自帶的ElementTree模塊,給你個例子你就知道了
xml文檔
?xml version=”1.0″ encoding=”utf-8″?
config
id0/id
log_pathE:/Python/log_path
/config
Python 代碼,修改id節的內容
from xml.etree import ElementTree
xml_file=’config.xml’
xml=ElementTree.ElementTree(file=xml_file).getroot()
xml.find(‘id’).text=1
用python怎麼操作xml文件內容
一、什麼是xml?
xml即可擴展標記語言,它可以用來標記數據、定義數據類型,是一種允許用戶對自己的標記語言進行定義的源語言。
abc.xml
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
Ok ,從結構上,它很像我們常見的HTML超文本標記語言。但他們被設計的目的是不同的,超文本標記語言被設計用來顯示數據,其焦點是數據的外觀。它被設計用來傳輸和存儲數據,其焦點是數據的內容。
那麼它有如下特徵:
首先,它是有標籤對組成,aa/aa
標籤可以有屬性:aa id=’123’/aa
標籤對可以嵌入數據:aaabc/aa
標籤可以嵌入子標籤(具有層級關係):
二、獲得標籤屬性
那麼,下面來介紹如何用python來讀取這種類型的文件。
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
print root.nodeName
print root.nodeValue
print root.nodeType
print root.ELEMENT_NODE
mxl.dom.minidom 模塊被用來處理xml文件,所以要先引入。
xml.dom.minidom.parse() 用於打開一個xml文件,並將這個文件對象dom變數。
documentElement 用於得到dom對象的文檔元素,並把獲得的對象給root
每一個結點都有它的nodeName,nodeValue,nodeType屬性。
nodeName為結點名字。
nodeValue是結點的值,只對文本結點有效。
nodeType是結點的類型。catalog是ELEMENT_NODE類型
現在有以下幾種:
‘ATTRIBUTE_NODE’
‘CDATA_SECTION_NODE’
‘COMMENT_NODE’
‘DOCUMENT_FRAGMENT_NODE’
‘DOCUMENT_NODE’
‘DOCUMENT_TYPE_NODE’
‘ELEMENT_NODE’
‘ENTITY_NODE’
‘ENTITY_REFERENCE_NODE’
‘NOTATION_NODE’
‘PROCESSING_INSTRUCTION_NODE’
‘TEXT_NODE’
三、獲得子標籤
現在要獲得catalog的子標籤以的標籤name
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
對於知道元素名字的子元素,可以使用getElementsByTagName方法獲取:
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
bb = root.getElementsByTagName(‘maxid’)
b= bb[0]
print b.nodeName
bb = root.getElementsByTagName(‘login’)
b= bb[0]
print b.nodeName
如何區分相同標籤名字的標籤:
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
caption和item標籤不止一個如何區分?
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
bb = root.getElementsByTagName(‘caption’)
b= bb[2]
print b.nodeName
bb = root.getElementsByTagName(‘item’)
b= bb[1]
print b.nodeName
root.getElementsByTagName(‘caption’) 獲得的是標籤為caption 一組標籤,b[0]表示一組標籤中的第一個;b[2] ,表示這一組標籤中的第三個。
四、獲得標籤屬性值
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
login和item標籤是有屬性的,如何獲得他們的屬性?
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
itemlist = root.getElementsByTagName(‘login’)
item = itemlist[0]
un=item.getAttribute(“username”)
print un
pd=item.getAttribute(“passwd”)
print pd
ii = root.getElementsByTagName(‘item’)
i1 = ii[0]
i=i1.getAttribute(“id”)
print i
i2 = ii[1]
i=i2.getAttribute(“id”)
print i
getAttribute方法可以獲得元素的屬性所對應的值。
五、獲得標籤對之間的數據
複製代碼代碼如下:
?xml version=”1.0″ encoding=”utf-8″?
catalog
maxid4/maxid
login username=”pytest” passwd=’123456′
captionPython/caption
item id=”4″
caption測試/caption
/item
/login
item id=”2″
captionZope/caption
/item
/catalog
caption標籤對之間是有數據的,如何獲得這些數據?
獲得標籤對之間的數據有多種方法,
方法一:
複製代碼代碼如下:
#coding=utf-8
import xml.dom.minidom
#打開xml文檔
dom = xml.dom.minidom.parse(‘abc.xml’)
#得到文檔元素對象
root = dom.documentElement
cc=dom.getElementsByTagName(‘caption’)
c1=cc[0]
print c1.firstChild.data
c2=cc[1]
print c2.firstChild.data
c3=cc[2]
print c3.firstChild.data
firstChild 屬性返回被選節點的第一個子節點,.data表示獲取該節點人數據。
方法二:
複製代碼代碼如下:
#coding=utf-8
from xml.etree import ElementTree as ET
per=ET.parse(‘abc.xml’)
p=per.findall(‘./login/item’)
for oneper in p:
for child in oneper.getchildren():
print child.tag,’:’,child.text
p=per.findall(‘./item’)
for oneper in p:
for child in oneper.getchildren():
print child.tag,’:’,child.text
方法二有點複雜,所引用模塊也與前面的不一樣,findall用於指定在哪一級標籤下開始遍歷。
getchildren方法按照文檔順序返回所有子標籤。並輸出標籤名(child.tag)和標籤的數據(child.text)
其實,方法二的作用不在於此,它核心功能是可以遍歷某一級標籤下的所有子標籤。
python解析xml,包含中文,gb2312編碼。修改xml後重新寫入xml有些內容怎麼變了? 我的步驟如下:
可能是python內置模塊的輸出是那樣的,不需要用ue轉,我覺得直接當文本讀入內容MSG,然後解碼再編碼msg.decode(“gb2312”).encode(“utf-8”),然後用正則表達式xx替換內容/xx來替換內容。。。個人覺得省事些,當然要看你具體情況
python 替換xml中的一行或者兩行
a=’Range 0-229956 /Range’
b=”‘Range 0-(A-1) /Range’\n’Range B-229956 /Range'”
d=open(“a.xml”,”w”)
while 1:
line=d.readline()
if line==a:
replace(a,b)
ifnotline:
break
##如果你的A,B兩個值是從終端讀取的話在開始read一下就行:
read A
read B
python操作xml文件問題
我給你個示例代碼,你自己改改增加子節點那一段就好了。
#!/usr/bin/python
# -*- coding=utf-8 -*-
# author : wklken@yeah.net
# date: 2012-05-25
# version: 0.1
from xml.etree.ElementTree import ElementTree,Element
def read_xml(in_path):
”’讀取並解析xml文件
in_path: xml路徑
return: ElementTree”’
tree = ElementTree()
tree.parse(in_path)
return tree
def write_xml(tree, out_path):
”’將xml文件寫出
tree: xml樹
out_path: 寫出路徑”’
tree.write(out_path, encoding=”utf-8″,xml_declaration=True)
def if_match(node, kv_map):
”’判斷某個節點是否包含所有傳入參數屬性
node: 節點
kv_map: 屬性及屬性值組成的map”’
for key in kv_map:
if node.get(key) != kv_map.get(key):
return False
return True
#—————search —–
def find_nodes(tree, path):
”’查找某個路徑匹配的所有節點
tree: xml樹
path: 節點路徑”’
return tree.findall(path)
def get_node_by_keyvalue(nodelist, kv_map):
”’根據屬性及屬性值定位符合的節點,返回節點
nodelist: 節點列表
kv_map: 匹配屬性及屬性值map”’
result_nodes = []
for node in nodelist:
if if_match(node, kv_map):
result_nodes.append(node)
return result_nodes
#—————change —–
def change_node_properties(nodelist, kv_map, is_delete=False):
”’修改/增加 /刪除 節點的屬性及屬性值
nodelist: 節點列表
kv_map:屬性及屬性值map”’
for node in nodelist:
for key in kv_map:
if is_delete:
if key in node.attrib:
del node.attrib[key]
else:
node.set(key, kv_map.get(key))
def change_node_text(nodelist, text, is_add=False, is_delete=False):
”’改變/增加/刪除一個節點的文本
nodelist:節點列表
text : 更新後的文本”’
for node in nodelist:
if is_add:
node.text += text
elif is_delete:
node.text = “”
else:
node.text = text
def create_node(tag, property_map, content):
”’新造一個節點
tag:節點標籤
property_map:屬性及屬性值map
content: 節點閉合標籤里的文本內容
return 新節點”’
element = Element(tag, property_map)
element.text = content
return element
def add_child_node(nodelist, element):
”’給一個節點添加子節點
nodelist: 節點列表
element: 子節點”’
for node in nodelist:
node.append(element)
def del_node_by_tagkeyvalue(nodelist, tag, kv_map):
”’同過屬性及屬性值定位一個節點,並刪除之
nodelist: 父節點列表
tag:子節點標籤
kv_map: 屬性及屬性值列表”’
for parent_node in nodelist:
children = parent_node.getchildren()
for child in children:
if child.tag == tag and if_match(child, kv_map):
parent_node.remove(child)
if __name__ == “__main__”:
#1. 讀取xml文件
tree = read_xml(“./test.xml”)
#2. 屬性修改
#A. 找到父節點
nodes = find_nodes(tree, “processers/processer”)
#B. 通過屬性準確定位子節點
result_nodes = get_node_by_keyvalue(nodes, {“name”:”BProcesser”})
#C. 修改節點屬性
change_node_properties(result_nodes, {“age”: “1”})
#D. 刪除節點屬性
change_node_properties(result_nodes, {“value”:””}, True)
#3. 節點修改
#A.新建節點
a = create_node(“person”, {“age”:”15″,”money”:”200000″}, “this is the firest content”)
#B.插入到父節點之下
add_child_node(result_nodes, a)
#4. 刪除節點
#定位父節點
del_parent_nodes = find_nodes(tree, “processers/services/service”)
#準確定位子節點並刪除之
target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, “chain”, {“sequency” : “chain1”})
#5. 修改節點文本
#定位節點
text_nodes = get_node_by_keyvalue(find_nodes(tree, “processers/services/service/chain”), {“sequency”:”chain3″})
change_node_text(text_nodes, “new text”)
#6. 輸出到結果文件
write_xml(tree, “./out.xml”)
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/189016.html