Pandas是Python的一個開源數據分析庫,專門用於數據操作和分析。其中apply()函數是Pandas中常用的數據操作函數之一,本文將從多個方面對這個函數進行詳細的闡述。
一、apply函數介紹
apply函數是Pandas中的通用函數,它能夠對某一維度的數據進行操作,然後返回一個數據集。apply()函數可以應用於DataFrame對象的行和列,也可以應用於Series對象。
具體的語法如下:
DataFrame.apply(func, axis=0, raw=False, result_type=None, args=(), **kwds)
參數說明:
- func:應用於Series或DataFrame的函數。
- axis:0表示按列應用,1表示按行應用。默認值為0。
- raw:如果為True,則在應用函數之前先通過values屬性使用numpy數組來檢索單個系列或數據幀中的基礎元素。
- result_type:指定返回值。{‘expand’, ‘reduce’,’broadcast’},這些取決於組後操作。默認值為None。
- args:另外的參數將傳遞給func。
- kwds:其他關鍵字參數將傳遞給func。
二、apply的使用場景
apply函數通常用於對數據進行按行或按列的操作。例如,對某一列的數據進行正則表達式匹配、對數據進行轉換等。
代碼示例:
import pandas as pd import numpy as np df = pd.DataFrame({'A': ['foo', 'bar', 'baz'], 'B': [1, 2, 3], 'C': [4.0, 5.0, 6.0]}) print(df.apply(np.cumsum, axis=0)) 輸出結果: A B C 0 foo 1 4.0 1 foobar 3 9.0 2 foobarbaz 6 15.0
三、apply的應用示例1:使用apply對數據進行轉換
apply函數可以用於數據的類型轉換。比如將字符串類型轉換成時間類型的操作就很適合使用apply函數。
這裡以將字符串轉換成時間為例:
import pandas as pd df = pd.DataFrame({'A':['2022-02-01 06:32:54.165587', '2022-02-02 07:32:54.166444', '2022-02-03 08:32:54.168822']}) df['A_datetime'] = df['A'].apply(lambda x: pd.to_datetime(x)) print(df)
輸出結果:
A A_datetime 0 2022-02-01 06:32:54.165587 2022-02-01 06:32:54.165587 1 2022-02-02 07:32:54.166444 2022-02-02 07:32:54.166444 2 2022-02-03 08:32:54.168822 2022-02-03 08:32:54.168822
四、apply的應用示例2:使用apply對數據進行相加操作
apply函數可以用於數據的數學計算。下面以對數據進行相加操作為例:
import pandas as pd df = pd.DataFrame({'A':[1,2,3,4,5],'B':[10,20,30,40,50]}) df['C'] = df.apply(lambda x: x['A'] + x['B'], axis=1) print(df)
輸出結果:
A B C 0 1 10 11 1 2 20 22 2 3 30 33 3 4 40 44 4 5 50 55
五、apply的應用示例3:使用apply對數據進行自定義處理
apply函數可以通過傳入自定義的函數對數據進行處理,比如使用正則表達式替換字符串。
代碼示例:
import pandas as pd df = pd.DataFrame({'A':['abc','def','ghi']}) def replace(string): return string.replace('a','x') df['A_new'] = df['A'].apply(replace) print(df)
輸出結果:
A A_new 0 abc xbc 1 def def 2 ghi ghi
六、總結
本文從apply函數的介紹、使用場景和示例等多個方面進行了詳細的闡述。apply函數是Pandas中的一個常用操作函數,可以對數據進行類型轉換、數學計算和自定義處理等操作。
原創文章,作者:AOXQZ,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/372215.html