Python是一种高级的、面向对象的编程语言,具有简洁、易读的语法和强大的标准库,常被用于Web开发、网络编程、数据分析、人工智能等多个领域。其中文件读写操作是Python编程中非常重要的一项技能,尤其在数据分析和人工智能领域中更是必不可少。
一、文件读写操作基础
Python提供了多种文件读写操作的方法,最常用的有以下三种:
# 打开文件
file = open('file.txt', 'r')
# 读取全部内容
content = file.read()
# 关闭文件
file.close()
上述代码中,首先通过open()函数打开了一个名为”file.txt”的文件,并以只读模式(‘r’)打开。接着使用read()函数从文件中读取全部的内容,最后使用close()函数关闭文件。
另一种常用的方式是逐行读取文件内容:
# 打开文件
file = open('file.txt', 'r')
# 逐行读取内容
for line in file:
print(line)
# 关闭文件
file.close()
上述代码中,使用for循环逐行读取文件内容,并使用print()函数输出。同样,最后使用close()函数关闭文件。
有时候我们需要向文件中写入一些内容,Python也提供了多种文件写入的方法:
# 打开文件
file = open('file.txt', 'w')
# 写入内容
file.write('hello, world!')
# 关闭文件
file.close()
上述代码中,使用open()函数以写入模式(‘w’)打开文件,并使用write()函数向文件中写入了”hello, world!”这句话。最后使用close()函数关闭文件。
二、文件读写操作进阶
1. 使用with语句自动关闭文件
在实际编程中,文件读写操作完成后一定要记得关闭文件。然而,如果程序出现异常或者其他原因导致程序没有关闭文件,就可能会出现资源泄漏的问题。为了避免这种情况的发生,Python提供了一个with语句来自动关闭文件:
# 使用with语句打开文件
with open('file.txt', 'r') as file:
content = file.read()
# with语句块结束后,文件自动关闭
2. 操作二进制文件
在进行文件读写操作时,有些文件是以二进制格式存储的,如图片、音频、视频等文件。Python同样可以进行二进制文件处理:
# 以二进制模式打开文件
with open('image.jpg', 'rb') as file:
content = file.read()
# 以二进制模式写入文件
with open('image_copy.jpg', 'wb') as file:
file.write(content)
3. 操作CSV文件
CSV(Comma-Separated Values)文件是常用的数据文件格式之一,在数据分析和机器学习中经常使用。Python中可以使用csv模块对CSV文件进行读写操作:
import csv
# 读取CSV文件
with open('data.csv', 'r') as file:
reader = csv.reader(file)
for row in reader:
print(row)
# 写入CSV文件
with open('data.csv', 'w', newline='') as file:
writer = csv.writer(file)
writer.writerow(['name', 'age', 'gender'])
writer.writerow(['Tom', '20', 'male'])
writer.writerow(['Lucy', '22', 'female'])
三、实战案例:统计文本中单词出现的次数
在实际开发中,我们通常会遇到需要统计文本中单词出现的次数的需求。下面给出一个实现的例子:
# 打开文件
with open('text.txt', 'r') as file:
content = file.read()
# 将字符串中的非字母字符替换为空格
content = re.sub('[^\w]', ' ', content)
# 将字符串分割成单词列表
words = content.split()
# 统计单词出现的次数
word_count = {}
for word in words:
if word.lower() in word_count:
word_count[word.lower()] += 1
else:
word_count[word.lower()] = 1
# 输出统计结果
for word, count in sorted(word_count.items(), key=lambda item: item[1], reverse=True):
print(word, count)
上述代码中,使用open()函数打开文本文件,并使用read()函数读取全部内容。接着使用re.sub()函数将字符串中的非字母字符替换为空格,使用split()函数将字符串分割成单词列表。最后使用字典来统计单词出现的次数,并使用sorted()函数对字典按值进行排序,并输出结果。
原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/247168.html
微信扫一扫
支付宝扫一扫