利用readlines()函数读取文件内容

一、readlines()函数的基本用法

with open('example.txt', 'r', encoding='utf8') as f:
    lines = f.readlines()
    for line in lines:
        print(line)

readlines()函数是Python中用于读取文件内容的函数之一。该函数返回一个列表,列表的每个元素对应输入文件中的一行文字。在文件读取过程中,输入文件会被Python自动分成若干行,在每个换行符处分割成列表的一个元素。readlines()函数经常被用于需要将整个文件内容一次性读入内存的情况。

在上面的代码中,首先通过with语句打开了名为example.txt的文件,并将其赋值给变量f。由于采用了with语句,所以无需再手动关闭打开的文件。然后使用f.readlines()函数一次性读入example.txt文件的所有内容,并将其赋值给变量lines。最后使用for循环遍历lines列表中的每个元素,也就是打印出文件的每一行内容。

二、对读入文件内容进行处理

with open('example.txt', 'r', encoding='utf8') as f:
    lines = f.readlines()
    words = []
    for line in lines:
        words += line.strip().split(' ')
    print(words)

readlines()函数返回的列表中,每个元素都是字符串形式的文本行。如果需要将文本拆成单个单词或者每个单词指定分隔符,可以使用Python的字符串函数split()。将每一行使用split()函数拆分后,每个单词一定是以空格隔开的。此时,我们可以通过遍历每一行,将每个单词加入到一个新的列表words中。

在上面的代码中,我们首先定义一个空列表words,然后遍历读入的文件内容。对于每一行,我们使用strip()函数删除其中的空白字符,接着用split()函数将该行拆成不同的单词,并将这些单词加入列表words中。最后使用print()函数打印结果。

三、读取大型文件的分块处理技巧

from itertools import islice
with open('example.txt', 'r', encoding='utf8') as f:
    while True:
        lines = list(islice(f, 1000))
        if not lines:
            break
        for line in lines:
            process(line)

readlines()函数将整个文件内容一次性读入内存。在处理小型文件时,这种方法无异,但是当文件较大时,readlines()函数会占用大量的内存,可能导致Python程序崩溃。为此,我们可以使用Python的迭代器islice(),对大型文件进行分块处理。

在上面的代码中,我们导入Python自带的迭代器模块,并将需要处理的文件example.txt打开。之后使用Python的while True循环,每次读取1000行,将它们存储到一个列表lines中。如果到文件结尾了,list(islice(f, 1000))就会返回一个空列表,此时可以跳出循环。最后遍历lines列表中的每个元素,对每一行文本进行处理。

四、逐行读取文件内容进行实时处理

with open('example.txt', 'r', encoding='utf8') as f:
    for line in f:
        process(line)

如果需要对大型文件进行实时处理,则应该逐行读取文件内容,并对每行进行处理。逐行读取可以使用Python的for循环来完成,如上例所示。

在上面的代码中,我们使用with语句打开example.txt文件,然后使用for循环,对于文件中的每一行,我们都调用了函数process进行处理。

五、读取二进制文件并转换为字符串

with open('example.jpg', 'rb') as f:
    img = f.read()
    imgstr = img.decode('utf8')

readlines()函数和for循环等读取文本文件内容的方法都需要以文本模式(’r’)打开文件。如果想要读取二进制文件,就需要使用二进制读取模式(’rb’)打开文件。例如,要读取图片文件,则需要使用二进制模式打开文件,这时读入的是图片的二进制文件。

在上面的代码中,我们使用with语句打开一个图片文件example.jpg,并且使用字节串方式(’rb’)读取了图片二进制内容。由于img是一个字节串,我们需要将其转换成字符串。为了实现这一点,可以使用Python自带的字符编码工具,如在decode()函数中指定utf8编码。

六、小结

本文讲解了Python中读取文件内容的基本方法:利用readlines()函数一次性读取整个文件内容、处理大型的文件内容分块读取、以及逐行读取文件实现实时处理等。除此之外,还介绍了如何将二进制文件读取为字符串。这些方法可以满足不同场景中的文件读取需求。

原创文章,作者:小蓝,如若转载,请注明出处:https://www.506064.com/n/271616.html

(0)
打赏 微信扫一扫 微信扫一扫 支付宝扫一扫 支付宝扫一扫
小蓝小蓝
上一篇 2024-12-16 19:23
下一篇 2024-12-16 19:23

相关推荐

  • Python中引入上一级目录中函数

    Python中经常需要调用其他文件夹中的模块或函数,其中一个常见的操作是引入上一级目录中的函数。在此,我们将从多个角度详细解释如何在Python中引入上一级目录的函数。 一、加入环…

    编程 2025-04-29
  • Python中capitalize函数的使用

    在Python的字符串操作中,capitalize函数常常被用到,这个函数可以使字符串中的第一个单词首字母大写,其余字母小写。在本文中,我们将从以下几个方面对capitalize函…

    编程 2025-04-29
  • vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常问题的解决

    本文旨在解决vue下载无后缀名的文件被加上后缀.txt,有后缀名的文件下载正常的问题,提供完整的代码示例供参考。 一、分析问题 首先,需了解vue中下载文件的情况。一般情况下,我们…

    编程 2025-04-29
  • 如何在Java中拼接OBJ格式的文件并生成完整的图像

    OBJ格式是一种用于表示3D对象的标准格式,通常由一组顶点、面和纹理映射坐标组成。在本文中,我们将讨论如何将多个OBJ文件拼接在一起,生成一个完整的3D模型。 一、读取OBJ文件 …

    编程 2025-04-29
  • Python中set函数的作用

    Python中set函数是一个有用的数据类型,可以被用于许多编程场景中。在这篇文章中,我们将学习Python中set函数的多个方面,从而深入了解这个函数在Python中的用途。 一…

    编程 2025-04-29
  • Python程序文件的拓展

    Python是一门功能丰富、易于学习、可读性高的编程语言。Python程序文件通常以.py为文件拓展名,被广泛应用于各种领域,包括Web开发、机器学习、科学计算等。为了更好地发挥P…

    编程 2025-04-29
  • Python中读入csv文件数据的方法用法介绍

    csv是一种常见的数据格式,通常用于存储小型数据集。Python作为一种广泛流行的编程语言,内置了许多操作csv文件的库。本文将从多个方面详细介绍Python读入csv文件的方法。…

    编程 2025-04-29
  • 三角函数用英语怎么说

    三角函数,即三角比函数,是指在一个锐角三角形中某一角的对边、邻边之比。在数学中,三角函数包括正弦、余弦、正切等,它们在数学、物理、工程和计算机等领域都得到了广泛的应用。 一、正弦函…

    编程 2025-04-29
  • 单片机打印函数

    单片机打印是指通过串口或并口将一些数据打印到终端设备上。在单片机应用中,打印非常重要。正确的打印数据可以让我们知道单片机运行的状态,方便我们进行调试;错误的打印数据可以帮助我们快速…

    编程 2025-04-29
  • 为什么用cmd运行Java时需要在文件内打开cmd为中心

    在Java开发中,我们经常会使用cmd在命令行窗口运行程序。然而,有时候我们会发现,在运行Java程序时,需要在文件内打开cmd为中心,这让很多开发者感到疑惑,那么,为什么会出现这…

    编程 2025-04-29

发表回复

登录后才能评论