python利用正則表達式取值的簡單介紹

本文目錄一覽：

1、python正則表達式怎麼提取
2、Python中如何用正則表達式獲取指定內容
3、python 正則表達式提取字典中的imUrl的value值
4、python怎麼根據正則表達式提取指定的內容
5、在python中使用正則表達式提取excel單元格中需要的信息
6、python怎麼用正則表達式提取中文？

python正則表達式怎麼提取

好正則後使用findall()或者group()方法獲取結果。

p = re.compile(r’input type=”hidden” name=”formhash” value=”(\w*)’)

match = p.search(html)

print match.group(1)

8a3ffba2

或者直接用re模塊方法

print re.search(r’input type=”hidden” name=”formhash” value=”(\w*)” /’, html).group(1)

8a3ffba2

。

Python中如何用正則表達式獲取指定內容

你要先學會分析網頁，

截圖截的太少了，你說內容都會變，卻只放出這麼多來，這樣誰也寫不出來。

只能寫出固定的。

text=”span男 23歲(1993年3月) 4年工作經驗大專未婚/span”

a=re.findall(‘工作經驗 (.*?) 未婚’,text,re.S)

print(a)

python 正則表達式提取字典中的imUrl的value值

對於你給的字符串,可以被看作一個字典,所以可以按照鍵值來提取imUrl的value值,也可以用正則表達式提取imUrl的value值.

兩種方法我都寫出來了,你看看吧,要用哪種方法,你自己決定.(因為回答問題不能出現鏈接,所以我把imUrl的value值改成了’imUrl鏈接’,意思是一樣的)

第一種方法

data={‘asin’: ‘0000037214’, ‘related’: {‘also_viewed’: [‘B00JO8II76’, ‘B00DGN4R1Q’, ‘B00E1YRI4C’]}, ‘title’: ‘Purple Sequin Tiny Dancer Tutu Ballet Dance Fairy Princess Costume Accessory’, ‘price’: 6.99, ‘salesRank’: {‘Clothing’: 1233557}, ‘imUrl’: ‘imUrl鏈接’, ‘brand’: ‘Big Dreams’,’categories’: [[‘Clothing, Shoes Jewelry’, ‘Girls’], [‘Clothing, Shoes Jewelry’, ‘Novelty, Costumes More’, ‘Costumes Accessories’, ‘More Accessories’, ‘Kids Baby’]]}

print(data[‘imUrl’])

源代碼(注意源代碼的縮進)

第二種方法

import re

data=”{‘asin’: ‘0000037214’, ‘related’: {‘also_viewed’: [‘B00JO8II76’, ‘B00DGN4R1Q’, ‘B00E1YRI4C’]}, ‘title’: ‘Purple Sequin Tiny Dancer Tutu Ballet Dance Fairy Princess Costume Accessory’, ‘price’: 6.99, ‘salesRank’: {‘Clothing’: 1233557}, ‘imUrl’: ‘imUrl鏈接’, ‘brand’: ‘Big Dreams’,’categories’: [[‘Clothing, Shoes Jewelry’, ‘Girls’], [‘Clothing, Shoes Jewelry’, ‘Novelty, Costumes More’, ‘Costumes Accessories’, ‘More Accessories’, ‘Kids Baby’]]}”

regex = r”‘imUrl’: ‘([\s\S]+?)'”

match_obj = re.findall(regex,data)

for i in range(len(match_obj)):

print(match_obj[i])

源代碼(注意源代碼的縮進)

python怎麼根據正則表達式提取指定的內容

#!/usr/bin/python3.4

# -*- coding: utf-8 -*-

import re

# 抓取html裡面string的正則表達式

def getstring(string):

reg = r'(line”\n)(.+?)()’

all = re.compile(reg)

alllist = re.findall(all, string)

return alllist[0][1]

if __name__ == ‘__main__’:

string = ”’

div class=”wgt-silder-push mod-shadow”

h2 class=”hd line”

我也來回答a alog-alias=”qb-silder-push-change” class=”grid-r btn-silder-push” href=”javascript:void(0);” id=”silder-push-change”換一換/a

/h2

/div

”’

print(getstring(string))

打印結果：

我也來回答

在python中使用正則表達式提取excel單元格中需要的信息

python是一款應用非常廣泛的腳本程序語言，谷歌公司的網頁就是用python編寫。python在生物信息、統計、網頁製作、計算等多個領域都體現出了強大的功能。python和其他腳本語言如java、R、Perl 一樣，都可以直接在命令行里運行腳本程序。工具/原料

python；CMD命令行；windows操作系統

方法/步驟

1、首先下載安裝python，建議安裝2.7版本以上，3.0版本以下，由於3.0版本以上不向下兼容，體驗較差。

2、打開文本編輯器，推薦editplus，notepad等，將文件保存成 .py格式，editplus和notepad支持識別python語法。

腳本第一行一定要寫上 #!usr/bin/python

表示該腳本文件是可執行python腳本

如果python目錄不在usr/bin目錄下，則替換成當前python執行程序的目錄。

3、編寫完腳本之後注意調試、可以直接用editplus調試。調試方法可自行百度。腳本寫完之後，打開CMD命令行，前提是python 已經被加入到環境變量中，如果沒有加入到環境變量，請百度

4、在CMD命令行中，輸入 “python” + “空格”，即 ”python “；將已經寫好的腳本文件拖拽到當前光標位置，然後敲回車運行即可。

python怎麼用正則表達式提取中文？

1、字符串line=’\ufeffD0002044\x01大數據\x01數據分析\x01技術\x01工具\x01應用\n’

想提取出其中的“大數據”，“數據分析”，“技術”，“工具”，“應用”這些中文，用了正則表達式：

pat2=’\x01(.*?)’

rs=re.compile(pat2).findall(line)

print(rs)

[”, ”, ”, ”, ”]

顯示的結果是空，請問如何才能正確的提出中文部分。

2、原文：法規名稱:’《中華人民共和國合同法》’,Items:[{法條名稱:’第五十二條’

匹配成：《中華人民共和國合同法》第五十二條

(?=法規名稱:\’).*?（\’,Items:[{法條名稱:\’）.*?(?=\’) 請問這樣匹配哪裡錯了？Python報sre_constants.error: unterminated character set at position 22

3、Python re正則匹配中文，其實非常簡單，把中文的unicode字符串轉換成utf-8格式就可以了，然後可以在re中隨意調用

unicode中中文的編碼為/u4e00-/u9fa5，因此正則表達式u”[\u4e00-\u9fa5]+”可以表示一個或者多個中文字符

import re

s=’中文：123456aa哈哈哈bbcc’.decode(‘utf8’)

u’\u4e2d\u6587\uff1a123456aa\u54c8\u54c8\u54c8bbcc’

print s

中文：123456aa哈哈哈bbcc 。

原創文章，作者：UXXFQ，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/329947.html

python利用正則表達式取值的簡單介紹

本文目錄一覽：

python正則表達式怎麼提取

Python中如何用正則表達式獲取指定內容

python 正則表達式提取字典中的imUrl的value值

python怎麼根據正則表達式提取指定的內容

在python中使用正則表達式提取excel單元格中需要的信息

python怎麼用正則表達式提取中文？

相關推薦

發表回復