Python中Pandas loc詳解：使用方法與示例

在進行Python的數據處理、分析或機器學習時，經常需要選取或篩選某些特定的數據。在Pandas庫中，使用 loc 函數可以實現這個目的。本篇文章將從多個方面詳細介紹 loc 函數的使用方法與實例。

一、基本介紹

loc 函數是 Pandas DataFrame 的一種選取數據的方法。其語法為：

df.loc[row_indices, col_indices]

其中， row_indices 與 col_indices 分別表示行和列的索引。row_indices可以是標籤（label）或位置（position），col_indices 也可以是標籤或位置。通過 loc 函數選取的行和列組成的 DataFrame 被稱為 loc 構造器（constructor）。

值得注意的是，選取數據時，loc 函數是包含結束位置的。

二、loc 函數的標籤選取與位置選取

1. 標籤選取

loc 函數的一個主要的應用場景是標籤選取。選取特定行或列的標籤，可以使用單個標籤、標籤列表或者切片：

#選取單個行和單個列
df.loc['a', 'A']

#選取多個行和多個列
df.loc[['a', 'c'], ['A', 'B']]

#選取行和列的切片
df.loc['b':'d', 'A':'C']

2. 位置選取

位置選取是以 0 開始的整數索引選取行或列。 loc 函數的位置選取與標籤選取類似，也可以使用單個整數、整數列表或者整數切片：

#選取單個行和單個列
df.loc[0, 2]

#選取多個行和多個列
df.loc[[0, 3], [1, 2]]

#選取行和列的切片
df.loc[1:3, 1:3]

三、使用 loc 函數進行條件選取

loc 函數可以使用布爾索引（Boolean indexing）來進行條件選取。對於一個 DataFrame d，布爾索引 e 的長度必須和 d 的行數相同。

以下是使用布爾索引進行條件選取的代碼示例：

#選取值大於 0 的元素
df.loc[df > 0]

#選取滿足 A 大於 0 的所有行
df.loc[df['A'] > 0]

#選取滿足兩個條件的所有行
df.loc[(df['A'] > 0) & (df['B'] > 0)]

四、loc 函數的高級用法

loc 函數還有一些高級用法，可以進行更複雜的數據選取操作。在本節中，我們將介紹三種高級用法：使用函數進行選取、使用多重標籤選取和使用 pd.IndexSlice 進行選取。

1. 使用函數進行選取

我們可以定義一個函數 f，該函數接受一個 DataFrame 作為參數，並返回需要選取的行或列的標籤或位置。然後，我們可以使用 loc 函數和函數 f 進行數據選取。

# 定義一個函數
def f(x):
    return x['A'] > 0

# 使用函數進行選取
df.loc[f]

2. 使用多重標籤進行選取

使用多重標籤進行選取是一種非常強大的功能。在 DataFrame 中，每一行或一列都可以包含多個標籤。我們可以使用元組（tuple）來指定多重標籤。

# 創建一個具有多重標籤的 DataFrame
df_multi_index = pd.DataFrame(np.random.randn(6, 6), columns=[['A', 'A', 'B', 'B', 'C', 'C'],
                                                            ['a1', 'a2', 'b1', 'b2', 'c1', 'c2']])

# 使用多重標籤進行選取
df_multi_index.loc[:, ('A', 'a2')]

3. 使用 pd.IndexSlice 進行選取

pd.IndexSlice 是一種高級用法，可以使用多個標籤和切片來進行選取。通過 pd.IndexSlice 我們可以更加靈活地選取我們需要的數據。

# 創建一個具有多重標籤的 DataFrame
df_multi_index = pd.DataFrame(np.random.randn(6, 6), columns=[['A', 'A', 'B', 'B', 'C', 'C'],
                                                            ['a1', 'a2', 'b1', 'b2', 'c1', 'c2']])

idx = pd.IndexSlice

# 使用 pd.IndexSlice 進行選取
df_multi_index.loc[:, idx[:,'a1']]

五、總結

本文詳細介紹了 Pandas 的 loc 函數的使用方法與實例。通過本文的學習，讀者可以更加深入地了解 loc 函數，在實際數據處理和分析中更加熟練地運用該函數，提高分析效率。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/187582.html