將Numpy數組存儲到文件的高效方法

一、Numpy數組的存儲方式

Numpy是Python中重要的科學計算庫,它提供了高性能的多維數組對象和豐富的函數庫。在處理大量數據時,如果直接使用Python自帶的列表進行操作,速度可能會十分緩慢。而使用Numpy數組則可以提高處理速度。在進行科學計算、數據分析等領域的研究過程中,常常需要將Numpy數組存儲到文件中,以便隨後使用。Numpy支持多種文件格式對數組進行存儲,包括二進位格式、文本格式、NPZ格式等。

二、二進位格式存儲Numpy數組

import numpy as np

arr = np.array([1, 2, 3])
arr.tofile('data.bin') #將數組存儲到二進位文件中
new_arr = np.fromfile('data.bin', dtype=np.int16) #從二進位文件中讀入數據

二進位格式最基本的存儲方式是使用Numpy提供的”tofile”函數,將數組直接存儲到硬碟中。”tofile”函數需要一個文件名作為參數來指定存儲的位置。可以通過祖先類型來指定存儲的數據類型,若沒有指定數據類型,則默認為float類型。在讀取二進位文件時,可以使用Numpy提供的”fromfile”函數,從文件中讀取數據,該函數讀入的數據需要手動reshape為原數組的形狀。

三、文本格式存儲Numpy數組

import numpy as np

arr = np.array([[1, 2, 3], [4, 5, 6]])
np.savetxt('data.txt', arr) #將數組存儲到文本文件中
new_arr = np.loadtxt('data.txt') #從文本文件中讀入數據

除了二進位文件外,我們也可以使用文本文件存儲Numpy數組。Numpy提供了”save”和”savez”函數來存儲Numpy數組為文本文件,其中”save”函數將數組保存為.npy文件,”savez”函數將數組保存為.npz文件。此外,Numpy還提供了”load”和”loadtxt”函數來從文件中讀取數據。”savetxt”函數可以將Numpy數組保存為txt文件或csv文件,具體可以指定分割符和小數點位數等參數。而”loadtxt”函數用於從txt文件中讀取數據,不支持讀取csv文件。

四、NPZ格式存儲多個Numpy數組

import numpy as np

arr1 = np.array([1, 2, 3])
arr2 = np.array([4, 5, 6])
np.savez('data.npz', arr1=arr1, arr2=arr2) #將多個數組存儲到npz文件中
data = np.load('data.npz') #從npz文件中讀入數據
new_arr1 = data['arr1'] #獲取存儲的第一個數組
new_arr2 = data['arr2'] #獲取存儲的第二個數組

NPZ格式是一種壓縮存儲多個Numpy數組的格式,與.npy格式不同,NPZ格式可以存儲多個數組,並且在進行讀取時,不需要手動將多個數組的文件名都傳遞給函數。我們可以使用”savez”函數將多個數組保存為一個npz文件,也可以使用”savez_compressed”函數將多個數組壓縮並存儲。

五、高效存儲大型Numpy數組

對於大型Numpy數組的存儲,我們需要考慮存儲效率和存儲速度。如果遇到非常大的多為數組,我們可以考慮使用”memmap”函數來直接在磁碟中對數組進行讀寫操作。

import numpy as np

big_arr = np.memmap('big_data.bin', dtype=np.float32, mode='w+', shape=(1000000, 1000)) #創建一個大型Numpy數組
big_arr[:] = np.random.rand(1000000, 1000) #將數組賦值為隨機數

“memmap”函數返回一個numpy.memmap對象,該對象在內存中只存儲數組的元數據,真正的數據存儲在磁碟中,使用者無需擔心內存限制問題。”memmap”函數需要提供文件名、數組的數據類型、讀寫模式和數組的維度大小等參數。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/293918.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-26 13:15
下一篇 2024-12-26 13:15

相關推薦

  • vue下載無後綴名的文件被加上後綴.txt,有後綴名的文件下載正常問題的解決

    本文旨在解決vue下載無後綴名的文件被加上後綴.txt,有後綴名的文件下載正常的問題,提供完整的代碼示例供參考。 一、分析問題 首先,需了解vue中下載文件的情況。一般情況下,我們…

    編程 2025-04-29
  • 解決.net 6.0運行閃退的方法

    如果你正在使用.net 6.0開發應用程序,可能會遇到程序閃退的情況。這篇文章將從多個方面為你解決這個問題。 一、代碼問題 代碼問題是導致.net 6.0程序閃退的主要原因之一。首…

    編程 2025-04-29
  • ArcGIS更改標註位置為中心的方法

    本篇文章將從多個方面詳細闡述如何在ArcGIS中更改標註位置為中心。讓我們一步步來看。 一、禁止標註智能調整 在ArcMap中設置標註智能調整可以自動將標註位置調整到最佳顯示位置。…

    編程 2025-04-29
  • Python創建分配內存的方法

    在python中,我們常常需要創建並分配內存來存儲數據。不同的類型和數據結構可能需要不同的方法來分配內存。本文將從多個方面介紹Python創建分配內存的方法,包括列表、元組、字典、…

    編程 2025-04-29
  • Python導入數組

    本文將為您詳細闡述Python導入數組的方法、優勢、適用場景等方面,並附上代碼示例。 一、numpy庫的使用 numpy是Python中一個強大的數學庫,其中提供了非常豐富的數學函…

    編程 2025-04-29
  • Python中init方法的作用及使用方法

    Python中的init方法是一個類的構造函數,在創建對象時被調用。在本篇文章中,我們將從多個方面詳細討論init方法的作用,使用方法以及注意點。 一、定義init方法 在Pyth…

    編程 2025-04-29
  • 如何在Java中拼接OBJ格式的文件並生成完整的圖像

    OBJ格式是一種用於表示3D對象的標準格式,通常由一組頂點、面和紋理映射坐標組成。在本文中,我們將討論如何將多個OBJ文件拼接在一起,生成一個完整的3D模型。 一、讀取OBJ文件 …

    編程 2025-04-29
  • 使用Vue實現前端AES加密並輸出為十六進位的方法

    在前端開發中,數據傳輸的安全性問題十分重要,其中一種保護數據安全的方式是加密。本文將會介紹如何使用Vue框架實現前端AES加密並將加密結果輸出為十六進位。 一、AES加密介紹 AE…

    編程 2025-04-29
  • Python程序文件的拓展

    Python是一門功能豐富、易於學習、可讀性高的編程語言。Python程序文件通常以.py為文件拓展名,被廣泛應用於各種領域,包括Web開發、機器學習、科學計算等。為了更好地發揮P…

    編程 2025-04-29
  • 用不同的方法求素數

    素數是指只能被1和自身整除的正整數,如2、3、5、7、11、13等。素數在密碼學、計算機科學、數學、物理等領域都有著廣泛的應用。本文將介紹幾種常見的求素數的方法,包括暴力枚舉法、埃…

    編程 2025-04-29

發表回復

登錄後才能評論