Python是一種高級的、面向對象的編程語言,具有簡潔、易讀的語法和強大的標準庫,常被用於Web開發、網路編程、數據分析、人工智慧等多個領域。其中文件讀寫操作是Python編程中非常重要的一項技能,尤其在數據分析和人工智慧領域中更是必不可少。
一、文件讀寫操作基礎
Python提供了多種文件讀寫操作的方法,最常用的有以下三種:
# 打開文件 file = open('file.txt', 'r') # 讀取全部內容 content = file.read() # 關閉文件 file.close()
上述代碼中,首先通過open()函數打開了一個名為”file.txt”的文件,並以只讀模式(‘r’)打開。接著使用read()函數從文件中讀取全部的內容,最後使用close()函數關閉文件。
另一種常用的方式是逐行讀取文件內容:
# 打開文件 file = open('file.txt', 'r') # 逐行讀取內容 for line in file: print(line) # 關閉文件 file.close()
上述代碼中,使用for循環逐行讀取文件內容,並使用print()函數輸出。同樣,最後使用close()函數關閉文件。
有時候我們需要向文件中寫入一些內容,Python也提供了多種文件寫入的方法:
# 打開文件 file = open('file.txt', 'w') # 寫入內容 file.write('hello, world!') # 關閉文件 file.close()
上述代碼中,使用open()函數以寫入模式(‘w’)打開文件,並使用write()函數向文件中寫入了”hello, world!”這句話。最後使用close()函數關閉文件。
二、文件讀寫操作進階
1. 使用with語句自動關閉文件
在實際編程中,文件讀寫操作完成後一定要記得關閉文件。然而,如果程序出現異常或者其他原因導致程序沒有關閉文件,就可能會出現資源泄漏的問題。為了避免這種情況的發生,Python提供了一個with語句來自動關閉文件:
# 使用with語句打開文件 with open('file.txt', 'r') as file: content = file.read() # with語句塊結束後,文件自動關閉
2. 操作二進位文件
在進行文件讀寫操作時,有些文件是以二進位格式存儲的,如圖片、音頻、視頻等文件。Python同樣可以進行二進位文件處理:
# 以二進位模式打開文件 with open('image.jpg', 'rb') as file: content = file.read() # 以二進位模式寫入文件 with open('image_copy.jpg', 'wb') as file: file.write(content)
3. 操作CSV文件
CSV(Comma-Separated Values)文件是常用的數據文件格式之一,在數據分析和機器學習中經常使用。Python中可以使用csv模塊對CSV文件進行讀寫操作:
import csv # 讀取CSV文件 with open('data.csv', 'r') as file: reader = csv.reader(file) for row in reader: print(row) # 寫入CSV文件 with open('data.csv', 'w', newline='') as file: writer = csv.writer(file) writer.writerow(['name', 'age', 'gender']) writer.writerow(['Tom', '20', 'male']) writer.writerow(['Lucy', '22', 'female'])
三、實戰案例:統計文本中單詞出現的次數
在實際開發中,我們通常會遇到需要統計文本中單詞出現的次數的需求。下面給出一個實現的例子:
# 打開文件 with open('text.txt', 'r') as file: content = file.read() # 將字元串中的非字母字元替換為空格 content = re.sub('[^\w]', ' ', content) # 將字元串分割成單詞列表 words = content.split() # 統計單詞出現的次數 word_count = {} for word in words: if word.lower() in word_count: word_count[word.lower()] += 1 else: word_count[word.lower()] = 1 # 輸出統計結果 for word, count in sorted(word_count.items(), key=lambda item: item[1], reverse=True): print(word, count)
上述代碼中,使用open()函數打開文本文件,並使用read()函數讀取全部內容。接著使用re.sub()函數將字元串中的非字母字元替換為空格,使用split()函數將字元串分割成單詞列表。最後使用字典來統計單詞出現的次數,並使用sorted()函數對字典按值進行排序,並輸出結果。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/247168.html