深入理解pandas的loc和iloc

一、loc介紹

在使用pandas進行數據分析時，loc和iloc是兩個非常重要的操作方法。loc是location的縮寫，在使用時需要輸入df.loc[:, col_name]或是df.loc[row_name, col_name]，其中row_name和col_name都是要進行過濾或者選取的條件。在實際的應用中，row_name可以是一個條件過濾的結果或者是某個具體的數值，col_name可以是字符串、列表或者是切片對象。

下面是一個例子：

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f', 'h'], columns=['one', 'two', 'three'])
# 增加一行數據
df = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])

# 對某一行進行選擇
print(df.loc['a'])

# 對某一列進行選擇
print(df.loc[:, ['one', 'two']])

# 對某一行、某一列進行選擇
print(df.loc[['a', 'c', 'h'], ['one', 'two']])

在上面的例子中，我們創建了一個5*3的隨機數矩陣，然後增加了一行數據。接下來使用loc選擇了某一行，某一列，以及某一行某一列的元素。

二、iloc介紹

iloc也是一個非常重要的操作方式，它是根據元素的下標進行選擇的，與loc不同的是，在使用時可以輸入數字。在使用中，iloc與loc的參數有點類似，iloc可以接受一個整數或者整數列表作為第一個參數，來進行行的選擇或者過濾。

同樣的，下面是一個例子：

import numpy as np
import pandas as pd

df = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f', 'h'], columns=['one', 'two', 'three'])
# 增加一行數據
df = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])

# 對第1行進行選擇
print(df.iloc[1])

# 對第1~3行進行選擇
print(df.iloc[1:4, :2])

# 對第1 ~3行，第 0, 2列進行選擇
print(df.iloc[[1, 3], [0, 2]])

在上面的例子中，我們同樣創建了一個隨機數矩陣然後增加了一行數據，接着使用iloc進行了行和列的選擇。

三、loc和iloc的差異

雖然loc和iloc用法類似，但是它們之間還是存在一些不同的區別。

1、loc使用字符串進行行和列的選擇，iloc使用下標進行行和列的選擇

這個是比較簡單的區別，上面已經講得比較清楚了。

2、loc使用的是閉區間進行選擇，iloc使用的則是開區間進行選擇

具體的說，如果用loc選取區間[a,b]，則結果會包括b，而用iloc選取[a:b]，則結果不會包括下標為b的元素。

3、loc可以進行布爾型索引，但是iloc不可以

loc能夠接受布爾型的條件，效果類似於在數據中使用where語句，選擇符合條件的元素。而iloc只能接受整數值，使用起來會受到一定程度的限制。

上面的3點是loc和iloc的主要區別，對於這兩個方法的實際應用，在編寫代碼時需要根據實際情況進行選擇。

原創文章，作者：CCDGZ，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/332872.html

深入理解pandas的loc和iloc

一、loc介紹

二、iloc介紹

三、loc和iloc的差異

相關推薦

發表回復