python操作xml創建網站的簡單介紹

本文目錄一覽:

如何用Python創建生成xml文檔文件的方法

1、內存數據產生

2、產生xml內存對象(也就是DOM樹)

3、產生根對象

4、往根對象里加數據

5、把xml內存對象寫到文件

python中xml具體怎麼用

pipinstalllxmlpython2.7.9自帶pip安裝工具。看下面圖片,圖中顯示本人電腦已經安裝好了。1.直接copy下載的模塊文件中已經有了模塊的文件,有些模塊只有一個文件,比如較早版本的BeautifulSoup,有些是一個文件夾,比如新版本BeautifulSoup就是一個叫做bs4的文件夾。把這些文件直接copy到你的python路徑下的/Lib/site-packages文件夾中,比如C:/Python27/Lib/site-packages。之後就可以在程序里直接引用了:importBeautifulSoup或者frombs4importBeautifulSoup這是根據你放置的文件位置不同而決定的。網上有人說直接放在Lib文件夾中就可以了。的確這樣也行,但Lib文件夾中都是自帶的模塊,看一下就會發現我們用過的random、re等模塊的代碼文件。而外部模塊一般放在site-packages文件夾中。2.setup.py很多模塊里都附帶了setup.py文件,有同學直接雙擊了,然後發現沒有用。它的使用方法是從命令行去到setup.py所在的路徑下,運行pythonsetup.pyinstall仔細看一下安裝時輸出的信息可以發現,在線學習這個命令做的事情其實也就是幫你把模塊的代碼copy到site-packages文件夾。3.setuptools使用setuptools可以直接根據模塊名稱來自動下載安裝,不需要自己再去尋找模塊的安裝文件。不過在使用之前,你得先安裝setuptools自身。windows平台的32位python,可以直接下載setuptools的exe文件安裝。

如何使用python生成xml

最近要用python生成一個xml格式的文件。因為有一些內容是中文,原來的xml文件中使用了CDATA 的部分。 而之前的python程序所用的庫中沒有 創建這個區域的方法。無奈研究了大半天。 最後用了 from lxml import etree 這個庫的方法。 這裡將可運行的 python程序分享出來。 供大家參考。 經過測試,這段代碼是可以直接運行生成xml格式內容的。

1 # -*- coding:utf-8 -*-

2 import sys

3 import time

4 import string

5

6 from lxml import etree

7

8

9 #設置默認字符集為UTF8 不然有些時候轉碼會出問題

10 default_encoding = ‘utf-8’

11 if sys.getdefaultencoding() != default_encoding:

12 reload(sys)

13 sys.setdefaultencoding(default_encoding)

14

15 def create_xml():

16

17 data = etree.Element(“data”)

18 #1 interface_version

19 interface_version_txt = ‘5’

20 interface_version = etree.SubElement(data, ‘interface_version’)

21 interface_version.text = interface_version_txt

22 #2 site

23 site_txt = ”

24 site = etree.SubElement(data, ‘site’)

25 site.text = site_txt

26 #3 lastmod

27 lastmod_txt = time.strftime(‘%Y-%m-%d’, time.localtime())

28 lastmod = etree.SubElement(data, ‘lastmod’)

29 lastmod.text = lastmod_txt

30 #5 app

31 app = etree.SubElement(data, ‘app’)

32 #6 title

33 title_txt = u’%s’ % ‘真心話大冒險’

34 title_txt = etree.CDATA(title_txt)

35 title = etree.SubElement(app, ‘title’)

36 title.text = title_txt

37 #7 appid

38 appid = etree.SubElement(app, ‘appid’)

39 appid.text = ‘%s’ % ‘222’

40

41 dataxml = etree.tostring(data, pretty_print=True, encoding=”UTF-8″, method=”xml”, xml_declaration=True, standalone=None)

42 print dataxml

43

44

47 if __name__ == ‘__main__’:

48 create_xml()

用python怎麼操作xml文件內容

一、什麼是xml?

xml即可擴展標記語言,它可以用來標記數據、定義數據類型,是一種允許用戶對自己的標記語言進行定義的源語言。

abc.xml

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

login username=”pytest” passwd=’123456′

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

Ok ,從結構上,它很像我們常見的HTML超文本標記語言。但他們被設計的目的是不同的,超文本標記語言被設計用來顯示數據,其焦點是數據的外觀。它被設計用來傳輸和存儲數據,其焦點是數據的內容。

那麼它有如下特徵:

首先,它是有標籤對組成,aa/aa

標籤可以有屬性:aa id=’123’/aa

標籤對可以嵌入數據:aaabc/aa

標籤可以嵌入子標籤(具有層級關係):

二、獲得標籤屬性

那麼,下面來介紹如何用python來讀取這種類型的文件。

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

print root.nodeName

print root.nodeValue

print root.nodeType

print root.ELEMENT_NODE

mxl.dom.minidom 模塊被用來處理xml文件,所以要先引入。

xml.dom.minidom.parse() 用於打開一個xml文件,並將這個文件對象dom變數。

documentElement 用於得到dom對象的文檔元素,並把獲得的對象給root

每一個結點都有它的nodeName,nodeValue,nodeType屬性。

nodeName為結點名字。

nodeValue是結點的值,只對文本結點有效。

nodeType是結點的類型。catalog是ELEMENT_NODE類型

現在有以下幾種:

‘ATTRIBUTE_NODE’

‘CDATA_SECTION_NODE’

‘COMMENT_NODE’

‘DOCUMENT_FRAGMENT_NODE’

‘DOCUMENT_NODE’

‘DOCUMENT_TYPE_NODE’

‘ELEMENT_NODE’

‘ENTITY_NODE’

‘ENTITY_REFERENCE_NODE’

‘NOTATION_NODE’

‘PROCESSING_INSTRUCTION_NODE’

‘TEXT_NODE’

三、獲得子標籤

現在要獲得catalog的子標籤以的標籤name

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

login username=”pytest” passwd=’123456′

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

對於知道元素名字的子元素,可以使用getElementsByTagName方法獲取:

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

bb = root.getElementsByTagName(‘maxid’)

b= bb[0]

print b.nodeName

bb = root.getElementsByTagName(‘login’)

b= bb[0]

print b.nodeName

如何區分相同標籤名字的標籤:

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

login username=”pytest” passwd=’123456′

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

caption和item標籤不止一個如何區分?

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

bb = root.getElementsByTagName(‘caption’)

b= bb[2]

print b.nodeName

bb = root.getElementsByTagName(‘item’)

b= bb[1]

print b.nodeName

root.getElementsByTagName(‘caption’) 獲得的是標籤為caption 一組標籤,b[0]表示一組標籤中的第一個;b[2] ,表示這一組標籤中的第三個。

四、獲得標籤屬性值

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

login username=”pytest” passwd=’123456′

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

login和item標籤是有屬性的,如何獲得他們的屬性?

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

itemlist = root.getElementsByTagName(‘login’)

item = itemlist[0]

un=item.getAttribute(“username”)

print un

pd=item.getAttribute(“passwd”)

print pd

ii = root.getElementsByTagName(‘item’)

i1 = ii[0]

i=i1.getAttribute(“id”)

print i

i2 = ii[1]

i=i2.getAttribute(“id”)

print i

getAttribute方法可以獲得元素的屬性所對應的值。

五、獲得標籤對之間的數據

複製代碼代碼如下:

?xml version=”1.0″ encoding=”utf-8″?

catalog

maxid4/maxid

login username=”pytest” passwd=’123456′

captionPython/caption

item id=”4″

caption測試/caption

/item

/login

item id=”2″

captionZope/caption

/item

/catalog

caption標籤對之間是有數據的,如何獲得這些數據?

獲得標籤對之間的數據有多種方法,

方法一:

複製代碼代碼如下:

#coding=utf-8

import xml.dom.minidom

#打開xml文檔

dom = xml.dom.minidom.parse(‘abc.xml’)

#得到文檔元素對象

root = dom.documentElement

cc=dom.getElementsByTagName(‘caption’)

c1=cc[0]

print c1.firstChild.data

c2=cc[1]

print c2.firstChild.data

c3=cc[2]

print c3.firstChild.data

firstChild 屬性返回被選節點的第一個子節點,.data表示獲取該節點人數據。

方法二:

複製代碼代碼如下:

#coding=utf-8

from xml.etree import ElementTree as ET

per=ET.parse(‘abc.xml’)

p=per.findall(‘./login/item’)

for oneper in p:

for child in oneper.getchildren():

print child.tag,’:’,child.text

p=per.findall(‘./item’)

for oneper in p:

for child in oneper.getchildren():

print child.tag,’:’,child.text

方法二有點複雜,所引用模塊也與前面的不一樣,findall用於指定在哪一級標籤下開始遍歷。

getchildren方法按照文檔順序返回所有子標籤。並輸出標籤名(child.tag)和標籤的數據(child.text)

其實,方法二的作用不在於此,它核心功能是可以遍歷某一級標籤下的所有子標籤。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/247442.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 13:21
下一篇 2024-12-12 13:21

相關推薦

  • Python周杰倫代碼用法介紹

    本文將從多個方面對Python周杰倫代碼進行詳細的闡述。 一、代碼介紹 from urllib.request import urlopen from bs4 import Bea…

    編程 2025-04-29
  • Python計算陽曆日期對應周幾

    本文介紹如何通過Python計算任意陽曆日期對應周幾。 一、獲取日期 獲取日期可以通過Python內置的模塊datetime實現,示例代碼如下: from datetime imp…

    編程 2025-04-29
  • 如何查看Anaconda中Python路徑

    對Anaconda中Python路徑即conda環境的查看進行詳細的闡述。 一、使用命令行查看 1、在Windows系統中,可以使用命令提示符(cmd)或者Anaconda Pro…

    編程 2025-04-29
  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • Python列表中負數的個數

    Python列表是一個有序的集合,可以存儲多個不同類型的元素。而負數是指小於0的整數。在Python列表中,我們想要找到負數的個數,可以通過以下幾個方面進行實現。 一、使用循環遍歷…

    編程 2025-04-29
  • 蝴蝶優化演算法Python版

    蝴蝶優化演算法是一種基於仿生學的優化演算法,模仿自然界中的蝴蝶進行搜索。它可以應用於多個領域的優化問題,包括數學優化、工程問題、機器學習等。本文將從多個方面對蝴蝶優化演算法Python版…

    編程 2025-04-29
  • Python字典去重複工具

    使用Python語言編寫字典去重複工具,可幫助用戶快速去重複。 一、字典去重複工具的需求 在使用Python編寫程序時,我們經常需要處理數據文件,其中包含了大量的重複數據。為了方便…

    編程 2025-04-29
  • python強行終止程序快捷鍵

    本文將從多個方面對python強行終止程序快捷鍵進行詳細闡述,並提供相應代碼示例。 一、Ctrl+C快捷鍵 Ctrl+C快捷鍵是在終端中經常用來強行終止運行的程序。當你在終端中運行…

    編程 2025-04-29
  • Python程序需要編譯才能執行

    Python 被廣泛應用於數據分析、人工智慧、科學計算等領域,它的靈活性和簡單易學的性質使得越來越多的人喜歡使用 Python 進行編程。然而,在 Python 中程序執行的方式不…

    編程 2025-04-29
  • Python清華鏡像下載

    Python清華鏡像是一個高質量的Python開發資源鏡像站,提供了Python及其相關的開發工具、框架和文檔的下載服務。本文將從以下幾個方面對Python清華鏡像下載進行詳細的闡…

    編程 2025-04-29

發表回復

登錄後才能評論