一、正則表達式簡介
正則表達式是一種強大的匹配字元串的工具,它可以在文本中搜索和匹配模式,而不是對每個單詞進行逐一匹配。在Python中,我們使用re模塊來使用正則表達式進行搜索。
正則表達式由一個或多個字元和元字元組成,它的匹配模式可用於搜索或替換字元串。元字元是一些具有特殊含義的字元,它們可以用於字元組合和重複匹配等操作。
例如,使用正則表達式在文本中找出所有以字母a開頭的單詞,我們可以使用以下代碼:
import re
text = 'apple is a fruit and a good one at that.'
pattern = r'\ba\w*'
match = re.findall(pattern, text)
print(match)
運行結果:
['apple', 'and', 'at']
上述代碼中,使用re模塊中的findall方法查找所有符合正則表達式的匹配項,\b表示單詞的開頭,\w表示字母、數字或下劃線,*表示零個或多個。
二、使用$匹配行尾
在正則表達式中,$表示行尾。我們可以使用它來匹配以特定字元結尾的行。
假設現在我們有一個文件rivers.txt,裡面包含了世界各大河流的名稱和長度,以製表符分隔:
Nile 6650
Amazon 6575
Yangtze 6300
Mississippi 6275
Yenisei 5540
Yellow 5464
Ob 5410
Parana 4880
Congo 4700
現在我們想要匹配行尾的數字。我們可以使用以下正則表達式:
import re
with open('rivers.txt', 'r') as file:
for line in file:
pattern = r'\d+$'
match = re.findall(pattern, line)
print(match)
運行結果:
['6650']
['6575']
['6300']
['6275']
['5540']
['5464']
['5410']
['4880']
['4700']
在上面的代碼中,我們使用了with關鍵字來打開文件,然後逐行讀取。$匹配行末的數字,\d+表示一個或多個數字。
三、應用舉例
我們可以將使用$來匹配行尾的技巧應用於各種情況中。下面是一些有用的示例:
1. 匹配IP地址的結尾
import re
ip = '192.168.0.1:8080'
pattern = r'\d+$'
match = re.findall(pattern, ip)
print(match)
運行結果:
['8080']
上述代碼中,我們匹配了IP地址後面的埠號。
2. 匹配文件擴展名後的字元串
import re
file_name = 'document.docx'
pattern = r'\w+$'
match = re.findall(pattern, file_name)
print(match)
運行結果:
['docx']
上述代碼中,我們匹配了文件名後面的擴展名。
3. 匹配以特定字元結尾的行
import re
text = 'Hello World!\n'
pattern = r'!\n$'
match = re.findall(pattern, text)
print(match)
運行結果:
['!\n']
上述代碼中,我們匹配了以!結尾的行。
四、總結
使用$實現匹配行尾是一個非常有用的技巧,它可以幫助我們快速查找特定文本的末尾。在實際中,我們可以根據需要進行多種組合,針對不同的需求進行正則表達式的編寫。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/199445.html