Python是一種高級的、面向對象的編程語言,具有簡潔、易讀的語法和強大的標準庫,常被用於Web開發、網路編程、數據分析、人工智慧等多個領域。其中文件讀寫操作是Python編程中非常重要的一項技能,尤其在數據分析和人工智慧領域中更是必不可少。
一、文件讀寫操作基礎
Python提供了多種文件讀寫操作的方法,最常用的有以下三種:
# 打開文件
file = open('file.txt', 'r')
# 讀取全部內容
content = file.read()
# 關閉文件
file.close()
上述代碼中,首先通過open()函數打開了一個名為”file.txt”的文件,並以只讀模式(‘r’)打開。接著使用read()函數從文件中讀取全部的內容,最後使用close()函數關閉文件。
另一種常用的方式是逐行讀取文件內容:
# 打開文件
file = open('file.txt', 'r')
# 逐行讀取內容
for line in file:
print(line)
# 關閉文件
file.close()
上述代碼中,使用for循環逐行讀取文件內容,並使用print()函數輸出。同樣,最後使用close()函數關閉文件。
有時候我們需要向文件中寫入一些內容,Python也提供了多種文件寫入的方法:
# 打開文件
file = open('file.txt', 'w')
# 寫入內容
file.write('hello, world!')
# 關閉文件
file.close()
上述代碼中,使用open()函數以寫入模式(‘w’)打開文件,並使用write()函數向文件中寫入了”hello, world!”這句話。最後使用close()函數關閉文件。
二、文件讀寫操作進階
1. 使用with語句自動關閉文件
在實際編程中,文件讀寫操作完成後一定要記得關閉文件。然而,如果程序出現異常或者其他原因導致程序沒有關閉文件,就可能會出現資源泄漏的問題。為了避免這種情況的發生,Python提供了一個with語句來自動關閉文件:
# 使用with語句打開文件
with open('file.txt', 'r') as file:
content = file.read()
# with語句塊結束後,文件自動關閉
2. 操作二進位文件
在進行文件讀寫操作時,有些文件是以二進位格式存儲的,如圖片、音頻、視頻等文件。Python同樣可以進行二進位文件處理:
# 以二進位模式打開文件
with open('image.jpg', 'rb') as file:
content = file.read()
# 以二進位模式寫入文件
with open('image_copy.jpg', 'wb') as file:
file.write(content)
3. 操作CSV文件
CSV(Comma-Separated Values)文件是常用的數據文件格式之一,在數據分析和機器學習中經常使用。Python中可以使用csv模塊對CSV文件進行讀寫操作:
import csv
# 讀取CSV文件
with open('data.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
print(row)
# 寫入CSV文件
with open('data.csv', 'w', newline='') as file:
writer = csv.writer(file)
writer.writerow(['name', 'age', 'gender'])
writer.writerow(['Tom', '20', 'male'])
writer.writerow(['Lucy', '22', 'female'])
三、實戰案例:統計文本中單詞出現的次數
在實際開發中,我們通常會遇到需要統計文本中單詞出現的次數的需求。下面給出一個實現的例子:
# 打開文件
with open('text.txt', 'r') as file:
content = file.read()
# 將字元串中的非字母字元替換為空格
content = re.sub('[^\w]', ' ', content)
# 將字元串分割成單詞列表
words = content.split()
# 統計單詞出現的次數
word_count = {}
for word in words:
if word.lower() in word_count:
word_count[word.lower()] += 1
else:
word_count[word.lower()] = 1
# 輸出統計結果
for word, count in sorted(word_count.items(), key=lambda item: item[1], reverse=True):
print(word, count)
上述代碼中,使用open()函數打開文本文件,並使用read()函數讀取全部內容。接著使用re.sub()函數將字元串中的非字母字元替換為空格,使用split()函數將字元串分割成單詞列表。最後使用字典來統計單詞出現的次數,並使用sorted()函數對字典按值進行排序,並輸出結果。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/247168.html
微信掃一掃
支付寶掃一掃