一、PandasObject類型
PandasObject是pandas庫在數據分析和處理中極其重要的一種基類,包含了Series和DataFrame兩個派生類。可以將PandasObject視為pandas庫的核心對象之一。
除了Series和DataFrame,還可以在PandasObject的基礎上開發其他類型的數據結構。
在PandasObject基類中,定義了很多通用的方法和操作,如Index對象和MultiIndex對象的創建、distinct、intersection等原型方法,為子類的開發提供了很多基礎的功能。
import pandas as pd
# 定義一個PandasObject對象
pobj = pd.core.generic.PandasObject([1,2,3,4])
# 判定pobj是否為PandasObject類型
print(isinstance(pobj, pd.core.generic.PandasObject)) # 輸出 True
二、PandasObject轉Float
PandasObject中往往會包含一些數值型數據,而在數據分析中,將這些數據做運算處理的前提往往是要將這些數值型數據從字符串轉化為float類型。可以通過pandas庫中的to_numeric方法實現這個目的。如果字符串不能被轉換為float,該方法默認返回nan。
import pandas as pd
# Series對象中,將字符串類型的所有數據轉化為float類型
s = pd.Series(['1', '2.5', '3.1', '-200', 'whatever'])
print(pd.to_numeric(s, errors='coerce'))
三、PandasObject轉字符串
PandasObject對象同樣包含將其他類型數據轉換為字符串的方法,比如在數據分析過程中,將日期類型的數據轉化為字符串類型的數據,方便後續的處理。可以通過pandas庫中的astype方法實現這個目的。
import pandas as pd
import numpy as np
# Series對象中,將所有float類型的數據轉化為字符串類型
s = pd.Series([1.0, 2.5, 3.1, -200.0, np.nan])
print(s.astype(str))
四、PandasObject轉Float後變成了NAN
在數據清洗的過程中,有時會將一些無法識別的數據類型轉化為NaN,以便後續的處理。可以通過pandas庫中的to_numeric方法實現這個目的。如果字符串不能被轉換為float,該方法默認返回nan。
import pandas as pd
# Series對象中,在數值類型轉換的過程中,將"whatever"轉換為NaN
s = pd.Series(['1', '2.5', '3.1', '-200', 'whatever'])
print(pd.to_numeric(s, errors='coerce'))
原創文章,作者:MAVU,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/138562.html
微信掃一掃
支付寶掃一掃