Pandas是Python的一個開源數據分析庫,專門用於數據操作和分析。其中apply()函數是Pandas中常用的數據操作函數之一,本文將從多個方面對這個函數進行詳細的闡述。
一、apply函數介紹
apply函數是Pandas中的通用函數,它能夠對某一維度的數據進行操作,然後返回一個數據集。apply()函數可以應用於DataFrame對象的行和列,也可以應用於Series對象。
具體的語法如下:
DataFrame.apply(func, axis=0, raw=False, result_type=None, args=(), **kwds)
參數說明:
- func:應用於Series或DataFrame的函數。
- axis:0表示按列應用,1表示按行應用。默認值為0。
- raw:如果為True,則在應用函數之前先通過values屬性使用numpy數組來檢索單個系列或數據幀中的基礎元素。
- result_type:指定返回值。{‘expand’, ‘reduce’,’broadcast’},這些取決於組後操作。默認值為None。
- args:另外的參數將傳遞給func。
- kwds:其他關鍵字參數將傳遞給func。
二、apply的使用場景
apply函數通常用於對數據進行按行或按列的操作。例如,對某一列的數據進行正則表達式匹配、對數據進行轉換等。
代碼示例:
import pandas as pd
import numpy as np
df = pd.DataFrame({'A': ['foo', 'bar', 'baz'],
'B': [1, 2, 3],
'C': [4.0, 5.0, 6.0]})
print(df.apply(np.cumsum, axis=0))
輸出結果:
A B C
0 foo 1 4.0
1 foobar 3 9.0
2 foobarbaz 6 15.0
三、apply的應用示例1:使用apply對數據進行轉換
apply函數可以用於數據的類型轉換。比如將字符串類型轉換成時間類型的操作就很適合使用apply函數。
這裡以將字符串轉換成時間為例:
import pandas as pd
df = pd.DataFrame({'A':['2022-02-01 06:32:54.165587', '2022-02-02 07:32:54.166444', '2022-02-03 08:32:54.168822']})
df['A_datetime'] = df['A'].apply(lambda x: pd.to_datetime(x))
print(df)
輸出結果:
A A_datetime
0 2022-02-01 06:32:54.165587 2022-02-01 06:32:54.165587
1 2022-02-02 07:32:54.166444 2022-02-02 07:32:54.166444
2 2022-02-03 08:32:54.168822 2022-02-03 08:32:54.168822
四、apply的應用示例2:使用apply對數據進行相加操作
apply函數可以用於數據的數學計算。下面以對數據進行相加操作為例:
import pandas as pd
df = pd.DataFrame({'A':[1,2,3,4,5],'B':[10,20,30,40,50]})
df['C'] = df.apply(lambda x: x['A'] + x['B'], axis=1)
print(df)
輸出結果:
A B C 0 1 10 11 1 2 20 22 2 3 30 33 3 4 40 44 4 5 50 55
五、apply的應用示例3:使用apply對數據進行自定義處理
apply函數可以通過傳入自定義的函數對數據進行處理,比如使用正則表達式替換字符串。
代碼示例:
import pandas as pd
df = pd.DataFrame({'A':['abc','def','ghi']})
def replace(string):
return string.replace('a','x')
df['A_new'] = df['A'].apply(replace)
print(df)
輸出結果:
A A_new
0 abc xbc
1 def def
2 ghi ghi
六、總結
本文從apply函數的介紹、使用場景和示例等多個方面進行了詳細的闡述。apply函數是Pandas中的一個常用操作函數,可以對數據進行類型轉換、數學計算和自定義處理等操作。
原創文章,作者:AOXQZ,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/372215.html
微信掃一掃
支付寶掃一掃