用Python實現正則表達式提取字元串信息

正則表達式是一種強大的工具，能夠在文本中搜索、匹配和編輯特定的模式。Python內置了re模塊，可以方便地使用正則表達式。在本文中，我們將介紹如何使用Python的re模塊來提取字元串信息。

一、正則表達式基礎

正則表達式是一種由字元和操作符組成的模式，用於匹配文本中特定的字元串。常見的操作符包括：

. 匹配任意單個字元，除了換行符。
* 匹配前面的字元零個或多個。
+ 匹配前面的字元一個或多個。
? 匹配前面的字元零個或一個。
| 指定多個可選項，匹配其中任意一個。
() 指定多個操作符的範圍。

例如，正則表達式“a.*b”可以匹配以字母a開頭、以字母b結尾，中間包含任意個字元的字元串。

import re

pattern = "a.*b"
text = "abcdefgab"

match = re.search(pattern, text)
if match:
    print(match.group())
    # output: "abcdefgab"

上面的代碼中，我們使用re.search()函數查找文本中符合正則表達式的字元串，並使用match.group()返回匹配的字元串。

二、常用正則表達式示例

以下是一些常用的正則表達式示例，可以根據實際情況進行相應的修改和使用。

1. 匹配郵箱地址

“\w+@\w+\.\w+”

該正則表達式能匹配符合常規格式的郵箱地址，例如：“example@example.com”

import re

pattern = "\w+@\w+\.\w+"
text = "Email: example@example.com"

match = re.search(pattern, text)
if match:
    print(match.group())
    # output: "example@example.com"

2. 匹配網址

“https?://[\w\./]+””

該正則表達式能匹配符合HTTP或HTTPS協議的網址，例如：“http://www.example.com”

import re

pattern = "https?://[\w\./]+"
text = "Website: http://www.example.com"

match = re.search(pattern, text)
if match:
    print(match.group())
    # output: "http://www.example.com"

3. 匹配手機號碼

“1[3456789]\d{9}”

該正則表達式能匹配符合中國大陸手機號碼的格式，例如：“13988888888”

import re

pattern = "1[3456789]\d{9}"
text = "Phone number: 13988888888"

match = re.search(pattern, text)
if match:
    print(match.group())
    # output: "13988888888"

4. 匹配身份證號碼

“\d{17}[\dxX]|\d{15}”

該正則表達式能匹配符合中國大陸身份證號碼的格式，例如：“420102199012011234”

import re

pattern = "\d{17}[\dxX]|\d{15}"
text = "ID card: 420102199012011234"

match = re.search(pattern, text)
if match:
    print(match.group())
    # output: "420102199012011234"

三、結語

本文簡要介紹了如何使用Python的re模塊實現正則表達式提取字元串信息。通過這篇文章，您可以學習到正則表達式的基礎知識，並掌握一些常用的正則表達式示例。

對於想要深入學習正則表達式的人來說，本文只是一個入門級別的介紹，建議繼續學習相關的書籍和資源，不斷提高自己的技能水平。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/244939.html