numpy.loadtxt詳解

numpy.loadtxt是numpy(數值計算庫)中用於從文本文件讀取數據的函數。它可以把文本文件中的數據轉換成numpy數組的形式，並且支持很多參數設置，以滿足不同的讀取需求。下面我們將從幾個方面來詳細講解numpy.loadtxt的用法和參數。

一、讀取數據的基本用法

import numpy as np

data = np.loadtxt('data.txt')
print(data)

以上代碼可以從名為”data.txt”的文本文件中讀取數據，並將其存儲在一個numpy數組中。默認情況下，loadtxt函數會假定文本文件中的數據是以空格分隔的，可以自動推斷出每一列數據的類型。如果不同列之間的分隔符不是空格，我們可以通過設置delimiter參數來指定分隔符。

二、指定數據類型和忽略某一列

我們可以通過dtype參數來指定每一列數據的類型。如下所示：

data = np.loadtxt('data.txt', dtype={'names': ('name', 'score'), 'formats': ('S10', 'f4')})
print(data)

在上面的代碼中，我們為第一列指定了一個字元串類型，長度為10（S10），並將其命名為”name”，為第二列指定了一個浮點類型（f4），並將其命名為”score”。如果某一列不需要讀取，我們可以通過usecols參數來忽略該列。如下所示：

data = np.loadtxt('data.txt', dtype={'names': ('name', 'score'), 'formats': ('S10', 'f4')}, usecols=(0, 2))
print(data)

上面的代碼中忽略了原數據的第2列，只讀取了第1列和第3列。

三、處理缺失值

在數據中我們有時可能會遇到缺失（NaN）的情況。我們可以通過指定某一列的defaultfmt參數來處理缺失值。

data = np.loadtxt('data.txt', dtype={'names': ('name', 'score'), 'formats': ('S10', 'f4'), 'defaultfmt': ('%s', 'nan')})
print(data)

上面的代碼中，我們通過指定某一列的defaultfmt參數為”nan”來處理缺失值。

四、設置列分隔符

如果文本文件中的不同列之間是以不同的分隔符分開的怎麼辦？我們可以通過設置comments參數來指定不同的分隔符。如下所示：

data = np.loadtxt('data.txt', delimiter=':', dtype={'names': ('name', 'score'), 'formats': ('S10', 'f4')}, comments='#')
print(data)

在上面的代碼中，我們通過設置delimiter參數為冒號來指定不同的分隔符，設置comments參數為”#”來忽略原數據中以”#”開頭的注釋行。上述代碼同樣實現了讀取文本文件並將數據轉換成numpy數組的功能。

五、指定讀取行數和跳過行數

有時候我們需要從文本文件中讀取特定的起始行和行數，比如從第2行開始讀取10行數據，可以通過指定skiprows參數來實現。

data = np.loadtxt('data.txt', dtype={'names': ('name', 'score'), 'formats': ('S10', 'f4')}, skiprows=1, max_rows=10)
print(data)

上面的代碼中，我們通過設置skiprows參數為1來跳過第一行（即表頭），設置max_rows參數為10來指定讀取10行數據。

六、指定讀取列的起始和結束位置

有時候我們只需要讀取某個範圍內的列，可以通過指定起始和結束列的位置來實現。如下所示：

data = np.loadtxt('data.txt', dtype={'names': ('name', 'score', 'age'), 'formats': ('S10', 'f4', 'i')}, usecols=(1, 2), delimiter=',', skiprows=1)
print(data)

在上面的代碼中，我們通過設置dtype參數和usecols參數來指定只讀取第2列和第3列的數據，並將其轉換成一個numpy數組。

除了以上幾個方面的用法，numpy.loadtxt還有很多其他的參數設置方式，可以滿足各種不同的需求。在實際應用中，我們可以根據實際需要選擇不同的參數來讀取數據，並進行進一步的處理和分析。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/303635.html