python修改xml中內容的簡單介紹

本文目錄一覽：

1、python 怎麼修改xml文件內容
2、求大神指教：如何用python讀取xml文件中指定標籤的文檔內容並將其修改？最好寫下詳細代碼，非常感謝哈！
3、用python怎麼操作xml文件內容
4、python解析xml，包含中文，gb2312編碼。修改xml後重新寫入xml有些內容怎麼變了？我的步驟如下：
5、python 替換xml中的一行或者兩行
6、python操作xml文件問題

python 怎麼修改xml文件內容

類似於：

#!/usr/bin/evn python

#coding:utf-8

try:

import xml.etree.cElementTree as ET

except ImportError:

import xml.etree.ElementTree as ET

import sys

try:

tree = ET.parse(“country.xml”) #打開xml文檔

#root = ET.fromstring(country_string) #從字元串傳遞xml

root = tree.getroot() #獲得root節點

except Exception, e:

print “Error:cannot parse file:country.xml.”

sys.exit(1)

print root.tag, “—“, root.attrib

for child in root:

print child.tag, “—“, child.attrib

print “*”*10

print root[0][1].text #通過下標訪問

print root[0].tag, root[0].text

print “*”*10

for country in root.findall(‘country’): #找到root節點下的所有country節點

rank = country.find(‘rank’).text #子節點下節點rank的值

name = country.get(‘name’) #子節點下屬性name的值

print name, rank

#修改xml文件

for country in root.findall(‘country’):

rank = int(country.find(‘rank’).text)

if rank 50:

root.remove(country)

tree.write(‘output.xml’)

給你推薦一篇文章看看吧：

求大神指教：如何用python讀取xml文件中指定標籤的文檔內容並將其修改？最好寫下詳細代碼，非常感謝哈！

使用python自帶的ElementTree模塊，給你個例子你就知道了

xml文檔

?xml version=”1.0″ encoding=”utf-8″?

config

id0/id

log_pathE:/Python/log_path

/config

Python 代碼，修改id節的內容

from xml.etree import ElementTree

xml_file=’config.xml’

xml=ElementTree.ElementTree(file=xml_file).getroot()

xml.find(‘id’).text=1

用python怎麼操作xml文件內容

一、什麼是xml？

xml即可擴展標記語言，它可以用來標記數據、定義數據類型，是一種允許用戶對自己的標記語言進行定義的源語言。

abc.xml

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

Ok ,從結構上，它很像我們常見的HTML超文本標記語言。但他們被設計的目的是不同的，超文本標記語言被設計用來顯示數據，其焦點是數據的外觀。它被設計用來傳輸和存儲數據，其焦點是數據的內容。

那麼它有如下特徵：

首先，它是有標籤對組成，aa/aa

標籤可以有屬性：aa id=’123’/aa

標籤對可以嵌入數據：aaabc/aa

標籤可以嵌入子標籤（具有層級關係）：

二、獲得標籤屬性

那麼，下面來介紹如何用python來讀取這種類型的文件。

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

print root.nodeName

print root.nodeValue

print root.nodeType

print root.ELEMENT_NODE

mxl.dom.minidom 模塊被用來處理xml文件，所以要先引入。

xml.dom.minidom.parse() 用於打開一個xml文件，並將這個文件對象dom變數。

documentElement 用於得到dom對象的文檔元素，並把獲得的對象給root

每一個結點都有它的nodeName，nodeValue，nodeType屬性。

nodeName為結點名字。

nodeValue是結點的值，只對文本結點有效。

nodeType是結點的類型。catalog是ELEMENT_NODE類型

現在有以下幾種：

‘ATTRIBUTE_NODE’

‘CDATA_SECTION_NODE’

‘COMMENT_NODE’

‘DOCUMENT_FRAGMENT_NODE’

‘DOCUMENT_NODE’

‘DOCUMENT_TYPE_NODE’

‘ELEMENT_NODE’

‘ENTITY_NODE’

‘ENTITY_REFERENCE_NODE’

‘NOTATION_NODE’

‘PROCESSING_INSTRUCTION_NODE’

‘TEXT_NODE’

三、獲得子標籤

現在要獲得catalog的子標籤以的標籤name

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

對於知道元素名字的子元素，可以使用getElementsByTagName方法獲取：

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

bb = root.getElementsByTagName(‘maxid’)

b= bb[0]

print b.nodeName

bb = root.getElementsByTagName(‘login’)

b= bb[0]

print b.nodeName

如何區分相同標籤名字的標籤：

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

caption和item標籤不止一個如何區分？

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

bb = root.getElementsByTagName(‘caption’)

b= bb[2]

print b.nodeName

bb = root.getElementsByTagName(‘item’)

b= bb[1]

print b.nodeName

root.getElementsByTagName(‘caption’) 獲得的是標籤為caption 一組標籤，b[0]表示一組標籤中的第一個；b[2] ，表示這一組標籤中的第三個。

四、獲得標籤屬性值

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

login和item標籤是有屬性的，如何獲得他們的屬性？

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

itemlist = root.getElementsByTagName(‘login’)

item = itemlist[0]

un=item.getAttribute(“username”)

print un

pd=item.getAttribute(“passwd”)

print pd

ii = root.getElementsByTagName(‘item’)

i1 = ii[0]

i=i1.getAttribute(“id”)

print i

i2 = ii[1]

i=i2.getAttribute(“id”)

print i

getAttribute方法可以獲得元素的屬性所對應的值。

五、獲得標籤對之間的數據

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

caption標籤對之間是有數據的，如何獲得這些數據？

獲得標籤對之間的數據有多種方法，

方法一：

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

cc=dom.getElementsByTagName(‘caption’)

c1=cc[0]

print c1.firstChild.data

c2=cc[1]

print c2.firstChild.data

c3=cc[2]

print c3.firstChild.data

firstChild 屬性返回被選節點的第一個子節點，.data表示獲取該節點人數據。

方法二：

複製代碼代碼如下:

#coding=utf-8

from xml.etree import ElementTree as ET

per=ET.parse(‘abc.xml’)

p=per.findall(‘./login/item’)

for oneper in p:

for child in oneper.getchildren():

print child.tag,’:’,child.text

p=per.findall(‘./item’)

for oneper in p:

for child in oneper.getchildren():

print child.tag,’:’,child.text

方法二有點複雜，所引用模塊也與前面的不一樣，findall用於指定在哪一級標籤下開始遍歷。

getchildren方法按照文檔順序返回所有子標籤。並輸出標籤名（child.tag）和標籤的數據（child.text）

其實，方法二的作用不在於此，它核心功能是可以遍歷某一級標籤下的所有子標籤。

python解析xml，包含中文，gb2312編碼。修改xml後重新寫入xml有些內容怎麼變了？我的步驟如下：

可能是python內置模塊的輸出是那樣的，不需要用ue轉，我覺得直接當文本讀入內容MSG,然後解碼再編碼msg.decode(“gb2312”).encode(“utf-8”)，然後用正則表達式xx替換內容/xx來替換內容。。。個人覺得省事些，當然要看你具體情況

python 替換xml中的一行或者兩行

a=’Range 0-229956 /Range’

b=”‘Range 0-(A-1) /Range’\n’Range B-229956 /Range'”

d=open(“a.xml”,”w”)

while 1:

line=d.readline()

if line==a:

replace(a,b)

ifnotline:

break

##如果你的A,B兩個值是從終端讀取的話在開始read一下就行：

read A

read B

python操作xml文件問題

我給你個示例代碼，你自己改改增加子節點那一段就好了。

#!/usr/bin/python

# -*- coding=utf-8 -*-

# author : wklken@yeah.net

# date: 2012-05-25

# version: 0.1

from xml.etree.ElementTree import ElementTree,Element

def read_xml(in_path):

”’讀取並解析xml文件

in_path: xml路徑

return: ElementTree”’

tree = ElementTree()

tree.parse(in_path)

return tree

def write_xml(tree, out_path):

”’將xml文件寫出

tree: xml樹

out_path: 寫出路徑”’

tree.write(out_path, encoding=”utf-8″,xml_declaration=True)

def if_match(node, kv_map):

”’判斷某個節點是否包含所有傳入參數屬性

node: 節點

kv_map: 屬性及屬性值組成的map”’

for key in kv_map:

if node.get(key) != kv_map.get(key):

return False

return True

#—————search —–

def find_nodes(tree, path):

”’查找某個路徑匹配的所有節點

tree: xml樹

path: 節點路徑”’

return tree.findall(path)

def get_node_by_keyvalue(nodelist, kv_map):

”’根據屬性及屬性值定位符合的節點，返回節點

nodelist: 節點列表

kv_map: 匹配屬性及屬性值map”’

result_nodes = []

for node in nodelist:

if if_match(node, kv_map):

result_nodes.append(node)

return result_nodes

#—————change —–

def change_node_properties(nodelist, kv_map, is_delete=False):

”’修改/增加 /刪除節點的屬性及屬性值

nodelist: 節點列表

kv_map:屬性及屬性值map”’

for node in nodelist:

for key in kv_map:

if is_delete:

if key in node.attrib:

del node.attrib[key]

else:

node.set(key, kv_map.get(key))

def change_node_text(nodelist, text, is_add=False, is_delete=False):

”’改變/增加/刪除一個節點的文本

nodelist:節點列表

text : 更新後的文本”’

for node in nodelist:

if is_add:

node.text += text

elif is_delete:

node.text = “”

else:

node.text = text

def create_node(tag, property_map, content):

”’新造一個節點

tag:節點標籤

property_map:屬性及屬性值map

content: 節點閉合標籤里的文本內容

return 新節點”’

element = Element(tag, property_map)

element.text = content

return element

def add_child_node(nodelist, element):

”’給一個節點添加子節點

nodelist: 節點列表

element: 子節點”’

for node in nodelist:

node.append(element)

def del_node_by_tagkeyvalue(nodelist, tag, kv_map):

”’同過屬性及屬性值定位一個節點，並刪除之

nodelist: 父節點列表

tag:子節點標籤

kv_map: 屬性及屬性值列表”’

for parent_node in nodelist:

children = parent_node.getchildren()

for child in children:

if child.tag == tag and if_match(child, kv_map):

parent_node.remove(child)

if __name__ == “__main__”:

#1. 讀取xml文件

tree = read_xml(“./test.xml”)

#2. 屬性修改

#A. 找到父節點

nodes = find_nodes(tree, “processers/processer”)

#B. 通過屬性準確定位子節點

result_nodes = get_node_by_keyvalue(nodes, {“name”:”BProcesser”})

#C. 修改節點屬性

change_node_properties(result_nodes, {“age”: “1”})

#D. 刪除節點屬性

change_node_properties(result_nodes, {“value”:””}, True)

#3. 節點修改

#A.新建節點

a = create_node(“person”, {“age”:”15″,”money”:”200000″}, “this is the firest content”)

#B.插入到父節點之下

add_child_node(result_nodes, a)

#4. 刪除節點

#定位父節點

del_parent_nodes = find_nodes(tree, “processers/services/service”)

#準確定位子節點並刪除之

target_del_node = del_node_by_tagkeyvalue(del_parent_nodes, “chain”, {“sequency” : “chain1”})

#5. 修改節點文本

#定位節點

text_nodes = get_node_by_keyvalue(find_nodes(tree, “processers/services/service/chain”), {“sequency”:”chain3″})

change_node_text(text_nodes, “new text”)

#6. 輸出到結果文件

write_xml(tree, “./out.xml”)

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/189016.html

python修改xml中內容的簡單介紹

本文目錄一覽：

python 怎麼修改xml文件內容

求大神指教：如何用python讀取xml文件中指定標籤的文檔內容並將其修改？最好寫下詳細代碼，非常感謝哈！

用python怎麼操作xml文件內容

python解析xml，包含中文，gb2312編碼。修改xml後重新寫入xml有些內容怎麼變了？ 我的步驟如下：

python 替換xml中的一行或者兩行

python操作xml文件問題

相關推薦

發表回復

python解析xml，包含中文，gb2312編碼。修改xml後重新寫入xml有些內容怎麼變了？我的步驟如下：