在統計學中,中位數是指將一組數據按照從小到大(或從大到小)的順序排列,處於中間位置的那個數。如果數據的個數是奇數,則中位數是這組數據中間那個數;如果數據的個數是偶數,則中位數是中間兩個數的平均數。
一、計算中位數的演算法
計算中位數的演算法有多種。以下是兩種常用方法:
方法一:排序法
def median(numbers):
numbers.sort() # 將列表從小到大排序
n = len(numbers)
mid = n // 2 # 求中間位置下標
if n % 2 == 0: # 如果數據的個數是偶數
return (numbers[mid-1] + numbers[mid]) / 2
else: # 如果數據的個數是奇數
return numbers[mid]
這種方法的時間複雜度為O(nlogn),因為它需要先對列表進行排序。
方法二:計數法
def median(numbers):
freq_dict = {} # 創建一個字典
for x in numbers:
freq_dict[x] = freq_dict.get(x, 0) + 1 # 統計每個數出現的次數
sorted_freq = sorted(freq_dict.items()) # 將字典按照鍵(即數值)排序
n = len(numbers)
mid = n // 2 # 求中間位置下標
count = 0
if n % 2 == 0: # 如果數據的個數是偶數
for num, freq in sorted_freq:
count += freq
if count == mid:
return (num + prev_num) / 2
elif count > mid:
return num
prev_num = num
else: # 如果數據的個數是奇數
for num, freq in sorted_freq:
count += freq
if count > mid:
return num
這種方法的時間複雜度為O(n),因為它只需要統計每個數出現的次數,並按照數值排序。
二、計算中位數的代碼示例
以下是一個計算中位數的完整代碼示例:
def median(numbers):
freq_dict = {} # 創建一個字典
for x in numbers:
freq_dict[x] = freq_dict.get(x, 0) + 1 # 統計每個數出現的次數
sorted_freq = sorted(freq_dict.items()) # 將字典按照鍵(即數值)排序
n = len(numbers)
mid = n // 2 # 求中間位置下標
count = 0
if n % 2 == 0: # 如果數據的個數是偶數
for num, freq in sorted_freq:
count += freq
if count == mid:
return (num + prev_num) / 2
elif count > mid:
return num
prev_num = num
else: # 如果數據的個數是奇數
for num, freq in sorted_freq:
count += freq
if count > mid:
return num
}
# 調用函數計算中位數
numbers = [1, 2, 3, 4, 5, 5, 7, 8, 9]
print(median(numbers))
輸出結果為5。
三、總結
計算中位數在統計學和數據處理中是一個非常常見的操作。本文介紹了兩種計算中位數的方法:排序法和計數法。排序法的時間複雜度為O(nlogn),計數法的時間複雜度為O(n)。在實際的應用中,應該根據數據的大小、數據分布和性能要求等不同的因素來選擇合適的方法。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/249325.html
微信掃一掃
支付寶掃一掃