Python正則表達式匹配入門教程

引言

正則表達式是文本處理中常用的工具，它可以用來匹配、查找和替換文本中的模式。在Python中，標準庫中的re模塊提供了對正則表達式的支持。通過學習正則表達式，可以提高文本處理的效率。本文將介紹Python正則表達式的基本語法、常用方法和示例應用，幫助讀者快速入門。

正文

一、正則表達式語法

正則表達式是由普通字符和特殊字符組成的字符串，用來匹配一個或多個字符。下面介紹一些常用的正則表達式語法：

1.普通字符：所有除特殊字符之外的字符都是普通字符，用來匹配自身。

import re

str = 'hello world'
pattern = 'hello'
result = re.match(pattern, str)
if result:
    print('匹配成功')
else:
    print('匹配失敗')

輸出結果：

匹配成功

2.特殊字符：具有特殊含義的字符，常用的特殊字符如下：

（1）元字符：用來匹配字符串的位置和數量。

^：匹配字符串的開頭。

$：匹配字符串的結尾。

.：匹配任意單個字符。

*：匹配前面的字符零次或多次。

+：匹配前面的字符至少一次。

?：匹配前面的字符零次或一次。

()：子組，用來對正則表達式進行分組和捕獲。

（2）字符集：用來匹配一個字符的集合。

[]：匹配括號內的任意一個字符。

[a-z]：匹配a到z之間的任意一個字符。

[^a-z]：匹配不在a到z之間的任意一個字符。

import re

str = 'hello world'
pattern = 'h.llo'
result = re.match(pattern, str)
if result:
    print('匹配成功')
else:
    print('匹配失敗')

輸出結果：

匹配成功

3.轉義字符：用來匹配特殊含義的字符本身。

\：將下一個字符標記為特殊字符。

\d：匹配任意一個數字字符。

\D：匹配任意一個非數字字符。

\s：匹配任意一個空白字符。

\S：匹配任意一個非空白字符。

\w：匹配任意一個單詞字符，包括字母、數字和下劃線。

\W：匹配任意一個非單詞字符。

import re

str = 'hello 123 world'
pattern = r'\d+'
result = re.findall(pattern, str)
print(result)

輸出結果：

['123']

二、re模塊的常用方法

re模塊提供了多個函數用於操作正則表達式，其中常用的函數如下：

1.re.match()：從字符串的開頭匹配正則表達式。

2.re.search()：掃描整個字符串匹配正則表達式。

3.re.findall()：找到字符串中所有匹配正則表達式的子串。

4.re.sub()：用來替換字符串中所有匹配正則表達式的子串。

下面分別介紹這些方法的用法：

import re

str = 'hello world'
pattern = 'world'
result = re.match(pattern, str)
if result:
    print('匹配成功')
else:
    print('匹配失敗')

輸出結果：

匹配失敗

import re

str = 'hello world'
pattern = 'world'
result = re.search(pattern, str)
if result:
    print('匹配成功')
else:
    print('匹配失敗')

輸出結果：

匹配成功

import re

str = 'hello 123 world'
pattern = r'\d+'
result = re.findall(pattern, str)
print(result)

輸出結果：

['123']

import re

str = 'hello 123 world'
pattern = r'\d+'
result = re.sub(pattern, '456', str)
print(result)

輸出結果：

hello 456 world

三、示例應用

正則表達式在文本處理中應用廣泛，本節將演示一些常見的示例應用場景。

1.匹配URL地址。

import re

str = 'https://www.baidu.com'
pattern = r'http[s]?://(?:[a-zA-Z]|[0-9]|[$-_@.&+]|[!*\(\),]|(?:%[0-9a-fA-F][0-9a-fA-F]))+'
result = re.findall(pattern, str)
print(result)

輸出結果：

['https://www.baidu.com']

2.匹配手機號碼。

import re

str = '13800138000,13900139000,13600136000'
pattern = r'1[3456789]\d{9}'
result = re.findall(pattern, str)
print(result)

輸出結果：

['13800138000', '13900139000', '13600136000']

3.匹配郵箱地址。

import re

str = 'abc@123.com,xyz@456.com'
pattern = r'[a-zA-Z0-9_-]+@[a-zA-Z0-9_-]+\.[a-zA-Z]{2,4}'
result = re.findall(pattern, str)
print(result)

輸出結果：

['abc@123.com', 'xyz@456.com']

總結

本文介紹了Python正則表達式的基本語法、常用方法和示例應用。正則表達式是文本處理中不可或缺的工具，通過學習能夠提高文本處理的效率。需要注意的是，正則表達式語法較為繁瑣，需要認真學習和理解。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/193768.html

Python正則表達式匹配入門教程

引言

正文

一、正則表達式語法

二、re模塊的常用方法

三、示例應用

總結

相關推薦

發表回復