Python Regex: 使用$實現匹配行尾

一、正則表達式簡介

正則表達式是一種強大的匹配字元串的工具，它可以在文本中搜索和匹配模式，而不是對每個單詞進行逐一匹配。在Python中，我們使用re模塊來使用正則表達式進行搜索。

正則表達式由一個或多個字元和元字元組成，它的匹配模式可用於搜索或替換字元串。元字元是一些具有特殊含義的字元，它們可以用於字元組合和重複匹配等操作。

例如，使用正則表達式在文本中找出所有以字母a開頭的單詞，我們可以使用以下代碼:


import re

text = 'apple is a fruit and a good one at that.'
pattern = r'\ba\w*'

match = re.findall(pattern, text)

print(match)

運行結果:


['apple', 'and', 'at']

上述代碼中，使用re模塊中的findall方法查找所有符合正則表達式的匹配項，\b表示單詞的開頭，\w表示字母、數字或下劃線，*表示零個或多個。

二、使用$匹配行尾

在正則表達式中，$表示行尾。我們可以使用它來匹配以特定字元結尾的行。

假設現在我們有一個文件rivers.txt，裡面包含了世界各大河流的名稱和長度，以製表符分隔:


Nile	6650
Amazon	6575
Yangtze	6300
Mississippi	6275
Yenisei	5540
Yellow	5464
Ob	5410
Parana	4880
Congo	4700

現在我們想要匹配行尾的數字。我們可以使用以下正則表達式:


import re

with open('rivers.txt', 'r') as file:
    for line in file:
        pattern = r'\d+$'
        match = re.findall(pattern, line)
        print(match)

運行結果:


['6650']
['6575']
['6300']
['6275']
['5540']
['5464']
['5410']
['4880']
['4700']

在上面的代碼中，我們使用了with關鍵字來打開文件，然後逐行讀取。$匹配行末的數字，\d+表示一個或多個數字。

三、應用舉例

我們可以將使用$來匹配行尾的技巧應用於各種情況中。下面是一些有用的示例:

1. 匹配IP地址的結尾


import re

ip = '192.168.0.1:8080'
pattern = r'\d+$'
match = re.findall(pattern, ip)
print(match)

運行結果:


['8080']

上述代碼中，我們匹配了IP地址後面的埠號。

2. 匹配文件擴展名後的字元串


import re

file_name = 'document.docx'
pattern = r'\w+$'
match = re.findall(pattern, file_name)
print(match)

運行結果:


['docx']

上述代碼中，我們匹配了文件名後面的擴展名。

3. 匹配以特定字元結尾的行


import re

text = 'Hello World!\n'
pattern = r'!\n$'
match = re.findall(pattern, text)
print(match)

運行結果:


['!\n']

上述代碼中，我們匹配了以!結尾的行。

四、總結

使用$實現匹配行尾是一個非常有用的技巧，它可以幫助我們快速查找特定文本的末尾。在實際中，我們可以根據需要進行多種組合，針對不同的需求進行正則表達式的編寫。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/199445.html

Python Regex: 使用$實現匹配行尾

一、正則表達式簡介

二、使用$匹配行尾

三、應用舉例

1. 匹配IP地址的結尾

2. 匹配文件擴展名後的字元串

3. 匹配以特定字元結尾的行

四、總結

相關推薦

發表回復