一、loc介紹
在使用pandas進行數據分析時,loc和iloc是兩個非常重要的操作方法。loc是location的縮寫,在使用時需要輸入df.loc[:, col_name]或是df.loc[row_name, col_name],其中row_name和col_name都是要進行過濾或者選取的條件。在實際的應用中,row_name可以是一個條件過濾的結果或者是某個具體的數值,col_name可以是字符串、列表或者是切片對象。
下面是一個例子:
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f', 'h'], columns=['one', 'two', 'three'])
# 增加一行數據
df = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
# 對某一行進行選擇
print(df.loc['a'])
# 對某一列進行選擇
print(df.loc[:, ['one', 'two']])
# 對某一行、某一列進行選擇
print(df.loc[['a', 'c', 'h'], ['one', 'two']])
在上面的例子中,我們創建了一個5*3的隨機數矩陣,然後增加了一行數據。接下來使用loc選擇了某一行,某一列,以及某一行某一列的元素。
二、iloc介紹
iloc也是一個非常重要的操作方式,它是根據元素的下標進行選擇的,與loc不同的是,在使用時可以輸入數字。在使用中,iloc與loc的參數有點類似,iloc可以接受一個整數或者整數列表作為第一個參數,來進行行的選擇或者過濾。
同樣的,下面是一個例子:
import numpy as np
import pandas as pd
df = pd.DataFrame(np.random.randn(5, 3), index=['a', 'c', 'e', 'f', 'h'], columns=['one', 'two', 'three'])
# 增加一行數據
df = df.reindex(['a', 'b', 'c', 'd', 'e', 'f', 'g', 'h'])
# 對第1行進行選擇
print(df.iloc[1])
# 對第1~3行進行選擇
print(df.iloc[1:4, :2])
# 對第1 ~3行,第 0, 2列進行選擇
print(df.iloc[[1, 3], [0, 2]])
在上面的例子中,我們同樣創建了一個隨機數矩陣然後增加了一行數據,接着使用iloc進行了行和列的選擇。
三、loc和iloc的差異
雖然loc和iloc用法類似,但是它們之間還是存在一些不同的區別。
1、loc使用字符串進行行和列的選擇,iloc使用下標進行行和列的選擇
這個是比較簡單的區別,上面已經講得比較清楚了。
2、loc使用的是閉區間進行選擇,iloc使用的則是開區間進行選擇
具體的說,如果用loc選取區間[a,b],則結果會包括b,而用iloc選取[a:b],則結果不會包括下標為b的元素。
3、loc可以進行布爾型索引,但是iloc不可以
loc能夠接受布爾型的條件,效果類似於在數據中使用where語句,選擇符合條件的元素。而iloc只能接受整數值,使用起來會受到一定程度的限制。
上面的3點是loc和iloc的主要區別,對於這兩個方法的實際應用,在編寫代碼時需要根據實際情況進行選擇。
原創文章,作者:CCDGZ,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/332872.html