引言
在我們的日常工作中,我們需要從文件名中提取出有用的信息,如文件名中包含的日期,版本號等等。而在Python中提取文件名中的有用信息並不困難。本文將為您介紹在Python中提取文件名為中心的方法。
正文
一、正則表達式提取文件名
正則表達式是一種通用的字符串匹配工具,它可以用於提取字符串中的有用信息。下面的代碼使用正則表達式提取文件名中的版本號。
import re filename = 'example-v1.2.3.txt' match = re.match(r'example-v(\d+\.\d+\.\d+)\.txt', filename) if match: version = match.group(1) print(version) # 輸出 '1.2.3'
在以上代碼中,使用re.match函數匹配文件名,正則表達式 ‘example-v(\d+\.\d+\.\d+)\.txt’ 匹配了包含版本號的文件名。括號中的\d+\.\d+\.\d+表示一個由數字和點號組成的字符串,這個字符串就是版本號。
二、os.path模塊提取文件名
Python內置的os.path模塊提供了一些用於處理文件路徑的函數,其中os.path.splitext函數可以將文件名拆分成文件名和擴展名。下面的代碼演示了如何使用os.path模塊提取文件名
import os filename = 'example.txt' basename = os.path.basename(filename) name, ext = os.path.splitext(basename) print(name) # 輸出 'example' print(ext) # 輸出 '.txt'
在以上代碼中,使用os.path.basename函數從文件名中獲取基本文件名 ‘example.txt’。接着,使用os.path.splitext函數將基本文件名拆分成文件名 ‘example’ 和擴展名 ‘.txt’。
三、字符串切片提取文件名
在一些情況下,我們可以直接使用字符串切片來獲取文件名的有用信息。下面的代碼演示了如何使用字符串切片提取文件名中的日期。
filename = 'example-20210615.txt' date = filename[len('example-'):len('example-')+8] print(date) # 輸出 '20210615'
在以上代碼中,獲取文件名 ‘example-20210615.txt’ 的日期,可以使用字符串切片 filename[len(‘example-‘):len(‘example-‘)+8],其中 [len(‘example-‘):len(‘example-‘)+8] 表示獲取從第8個字符開始,共計8個字符的子串。
四、使用pathlib庫提取文件名
在Python 3.4及以後版本,Python 提供了一個新的標準庫 —— pathlib,裡面封裝了一些現代化的路徑操作相關的方法。下面的代碼演示了如何使用pathlib庫提取文件名。
from pathlib import Path filename = 'example.txt' p = Path(filename) print(p.stem) # 輸出 'example' print(p.suffix) # 輸出 '.txt'
在以上代碼中,使用 Path(filename) 創建了一個Path對象,然後我們可以使用該對象的 .stem 和 .suffix 方法分別獲取基本文件名和擴展名。
小結
本文介紹了Python中提取文件名為中心的幾種方法,包括正則表達式、os.path模塊、字符串切片和pathlib庫等。這些方法各有優劣,我們可以根據具體情況選擇使用哪一種方法。希望本文能對你在文件名處理上提供幫助。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/151068.html