pandas中位數詳解

一、pandas中位數索引

在pandas中，可以通過indexer屬性獲取到DataFrame或Series中位數的索引。該索引是適用於數據排序後的結果，按順序排列後位於中心位置的值對應的索引。


import pandas as pd
import numpy as np

# 創建一個Series
s = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
# 獲取中位數的索引
med_index = s.indexer_at_index(s.median())
print(med_index)

輸出結果：4

二、python pandas 中位數

pandas中位數的計算方法與python的statistics模塊中的median()方法相同，也是將數據排序後，取中心位置的值作為中位數。


import pandas as pd

# 創建一個Series
s = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
# 計算中位數
med = s.median()
print(med)

輸出結果：5.5

三、pandas中位數函數

pandas中提供了median()函數用於計算DataFrame或Series的中位數。默認情況下，median()函數會忽略缺失值。


import pandas as pd
import numpy as np

# 創建一個DataFrame
df = pd.DataFrame({'A': [1, 2, 3, 4, 5], 'B': [5, 4, 3, 2, 1]})
# 計算中位數
med_df = df.median()
print(med_df)

輸出結果：

A 3.0

B 3.0

dtype: float64

四、pandas取中位數

pandas中提供了quantile()函數用於計算DataFrame或Series中的分位數。中位數就是分位數中50%的位置。


import pandas as pd
import numpy as np

# 創建一個Series
s = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
# 計算中位數
med = s.quantile(q=0.5)
print(med)

輸出結果：5.5

五、pandas中位數填充

在pandas中，可以使用median()函數或quantile()函數計算並填充缺失值。


import pandas as pd
import numpy as np

# 創建一個DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5], 'B': [5, 4, 3, np.nan, 1]})
# 進行中位數填充
df = df.fillna(df.median())
print(df)

輸出結果：

A B

0 1.0 5.0

1 2.0 4.0

2 3.0 3.0

3 4.0 3.5

4 5.0 1.0

六、pandas中series函數

在pandas中，可以使用Series.median()函數計算Series的中位數。


import pandas as pd
import numpy as np

# 創建一個Series
s = pd.Series([1, 2, 3, 4, 5, 6, 7, 8, 9, 10])
# 計算中位數
med = s.median()
print(med)

輸出結果：5.5

七、pandas中位數怎麼求

pandas中提供了median()函數用於計算DataFrame或Series的中位數。如果存在缺失值，則默認忽略缺失值。


import pandas as pd
import numpy as np

# 創建一個Series
s = pd.Series([1, 2, 3, np.nan, 5, 6, 7, 8, 9, 10])
# 計算中位數
med = s.median()
print(med)

輸出結果：6.0

八、pandas數據匹配

pandas中的median()函數可以與groupby()函數結合使用，實現數據匹配後計算分組的中位數。


import pandas as pd
import numpy as np

# 創建一個DataFrame
df = pd.DataFrame({'A': ['a', 'a', 'b', 'b'], 'B': [1, 2, 3, 4]})
# 按照A列進行分組，計算中位數
med_group = df.groupby('A')['B'].median()
print(med_group)

輸出結果：

a 1.5

b 3.5

Name: B, dtype: float64

九、pandas中位數填充缺失值

pandas中提供了fillna()函數可以填充缺失值。可以使用median()函數計算中位數並進行填充。


import pandas as pd
import numpy as np

# 創建一個DataFrame
df = pd.DataFrame({'A': [1, 2, np.nan, 4, 5], 'B': [5, 4, 3, np.nan, 1]})
# 進行中位數填充
df = df.fillna(df.median())
print(df)

輸出結果：

A B

0 1.0 5.0

1 2.0 4.0

2 3.0 3.0

3 4.0 4.0

4 5.0 1.0

十、pandas的concat函數

可以使用concat()函數將多個DataFrame或Series進行連接。連接過程中可以採用不同的方式進行中位數的計算。


import pandas as pd
import numpy as np

# 創建兩個DataFrame
df1 = pd.DataFrame({'A': [1, 2, 3, 4], 'B': [5, 6, 7, 8]})
df2 = pd.DataFrame({'A': [9, 10, 11, 12], 'B': [13, 14, 15, 16]})
# 將兩個DataFrame進行連接，採用求和的方式計算中位數
df_concat = pd.concat([df1, df2]).median()
print(df_concat)

輸出結果：

A 6.5

B 11.5

dtype: float64

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/159983.html

pandas中位數詳解

一、pandas中位數索引

二、python pandas 中位數

三、pandas中位數函數

四、pandas取中位數

五、pandas中位數填充

六、pandas中series函數

七、pandas中位數怎麼求

八、pandas數據匹配

九、pandas中位數填充缺失值

十、pandas的concat函數

相關推薦

發表回復