利用readlines()函數讀取文件內容

一、readlines()函數的基本用法

with open('example.txt', 'r', encoding='utf8') as f:
    lines = f.readlines()
    for line in lines:
        print(line)

readlines()函數是Python中用於讀取文件內容的函數之一。該函數返回一個列表,列表的每個元素對應輸入文件中的一行文字。在文件讀取過程中,輸入文件會被Python自動分成若干行,在每個換行符處分割成列表的一個元素。readlines()函數經常被用於需要將整個文件內容一次性讀入內存的情況。

在上面的代碼中,首先通過with語句打開了名為example.txt的文件,並將其賦值給變量f。由於採用了with語句,所以無需再手動關閉打開的文件。然後使用f.readlines()函數一次性讀入example.txt文件的所有內容,並將其賦值給變量lines。最後使用for循環遍歷lines列表中的每個元素,也就是打印出文件的每一行內容。

二、對讀入文件內容進行處理

with open('example.txt', 'r', encoding='utf8') as f:
    lines = f.readlines()
    words = []
    for line in lines:
        words += line.strip().split(' ')
    print(words)

readlines()函數返回的列表中,每個元素都是字符串形式的文本行。如果需要將文本拆成單個單詞或者每個單詞指定分隔符,可以使用Python的字符串函數split()。將每一行使用split()函數拆分後,每個單詞一定是以空格隔開的。此時,我們可以通過遍歷每一行,將每個單詞加入到一個新的列表words中。

在上面的代碼中,我們首先定義一個空列表words,然後遍歷讀入的文件內容。對於每一行,我們使用strip()函數刪除其中的空白字符,接着用split()函數將該行拆成不同的單詞,並將這些單詞加入列表words中。最後使用print()函數打印結果。

三、讀取大型文件的分塊處理技巧

from itertools import islice
with open('example.txt', 'r', encoding='utf8') as f:
    while True:
        lines = list(islice(f, 1000))
        if not lines:
            break
        for line in lines:
            process(line)

readlines()函數將整個文件內容一次性讀入內存。在處理小型文件時,這種方法無異,但是當文件較大時,readlines()函數會佔用大量的內存,可能導致Python程序崩潰。為此,我們可以使用Python的迭代器islice(),對大型文件進行分塊處理。

在上面的代碼中,我們導入Python自帶的迭代器模塊,並將需要處理的文件example.txt打開。之後使用Python的while True循環,每次讀取1000行,將它們存儲到一個列表lines中。如果到文件結尾了,list(islice(f, 1000))就會返回一個空列表,此時可以跳出循環。最後遍歷lines列表中的每個元素,對每一行文本進行處理。

四、逐行讀取文件內容進行實時處理

with open('example.txt', 'r', encoding='utf8') as f:
    for line in f:
        process(line)

如果需要對大型文件進行實時處理,則應該逐行讀取文件內容,並對每行進行處理。逐行讀取可以使用Python的for循環來完成,如上例所示。

在上面的代碼中,我們使用with語句打開example.txt文件,然後使用for循環,對於文件中的每一行,我們都調用了函數process進行處理。

五、讀取二進制文件並轉換為字符串

with open('example.jpg', 'rb') as f:
    img = f.read()
    imgstr = img.decode('utf8')

readlines()函數和for循環等讀取文本文件內容的方法都需要以文本模式(’r’)打開文件。如果想要讀取二進制文件,就需要使用二進制讀取模式(’rb’)打開文件。例如,要讀取圖片文件,則需要使用二進制模式打開文件,這時讀入的是圖片的二進制文件。

在上面的代碼中,我們使用with語句打開一個圖片文件example.jpg,並且使用字節串方式(’rb’)讀取了圖片二進制內容。由於img是一個字節串,我們需要將其轉換成字符串。為了實現這一點,可以使用Python自帶的字符編碼工具,如在decode()函數中指定utf8編碼。

六、小結

本文講解了Python中讀取文件內容的基本方法:利用readlines()函數一次性讀取整個文件內容、處理大型的文件內容分塊讀取、以及逐行讀取文件實現實時處理等。除此之外,還介紹了如何將二進制文件讀取為字符串。這些方法可以滿足不同場景中的文件讀取需求。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/271616.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-16 19:23
下一篇 2024-12-16 19:23

相關推薦

  • Python中引入上一級目錄中函數

    Python中經常需要調用其他文件夾中的模塊或函數,其中一個常見的操作是引入上一級目錄中的函數。在此,我們將從多個角度詳細解釋如何在Python中引入上一級目錄的函數。 一、加入環…

    編程 2025-04-29
  • Python中capitalize函數的使用

    在Python的字符串操作中,capitalize函數常常被用到,這個函數可以使字符串中的第一個單詞首字母大寫,其餘字母小寫。在本文中,我們將從以下幾個方面對capitalize函…

    編程 2025-04-29
  • vue下載無後綴名的文件被加上後綴.txt,有後綴名的文件下載正常問題的解決

    本文旨在解決vue下載無後綴名的文件被加上後綴.txt,有後綴名的文件下載正常的問題,提供完整的代碼示例供參考。 一、分析問題 首先,需了解vue中下載文件的情況。一般情況下,我們…

    編程 2025-04-29
  • 如何在Java中拼接OBJ格式的文件並生成完整的圖像

    OBJ格式是一種用於表示3D對象的標準格式,通常由一組頂點、面和紋理映射坐標組成。在本文中,我們將討論如何將多個OBJ文件拼接在一起,生成一個完整的3D模型。 一、讀取OBJ文件 …

    編程 2025-04-29
  • Python中set函數的作用

    Python中set函數是一個有用的數據類型,可以被用於許多編程場景中。在這篇文章中,我們將學習Python中set函數的多個方面,從而深入了解這個函數在Python中的用途。 一…

    編程 2025-04-29
  • Python程序文件的拓展

    Python是一門功能豐富、易於學習、可讀性高的編程語言。Python程序文件通常以.py為文件拓展名,被廣泛應用於各種領域,包括Web開發、機器學習、科學計算等。為了更好地發揮P…

    編程 2025-04-29
  • Python中讀入csv文件數據的方法用法介紹

    csv是一種常見的數據格式,通常用於存儲小型數據集。Python作為一種廣泛流行的編程語言,內置了許多操作csv文件的庫。本文將從多個方面詳細介紹Python讀入csv文件的方法。…

    編程 2025-04-29
  • 三角函數用英語怎麼說

    三角函數,即三角比函數,是指在一個銳角三角形中某一角的對邊、鄰邊之比。在數學中,三角函數包括正弦、餘弦、正切等,它們在數學、物理、工程和計算機等領域都得到了廣泛的應用。 一、正弦函…

    編程 2025-04-29
  • 單片機打印函數

    單片機打印是指通過串口或並口將一些數據打印到終端設備上。在單片機應用中,打印非常重要。正確的打印數據可以讓我們知道單片機運行的狀態,方便我們進行調試;錯誤的打印數據可以幫助我們快速…

    編程 2025-04-29
  • 為什麼用cmd運行Java時需要在文件內打開cmd為中心

    在Java開發中,我們經常會使用cmd在命令行窗口運行程序。然而,有時候我們會發現,在運行Java程序時,需要在文件內打開cmd為中心,這讓很多開發者感到疑惑,那麼,為什麼會出現這…

    編程 2025-04-29

發表回復

登錄後才能評論