在統計學中,中位數是指將一組數據按照從小到大(或從大到小)的順序排列,處於中間位置的那個數。如果數據的個數是奇數,則中位數是這組數據中間那個數;如果數據的個數是偶數,則中位數是中間兩個數的平均數。
一、計算中位數的演算法
計算中位數的演算法有多種。以下是兩種常用方法:
方法一:排序法
def median(numbers): numbers.sort() # 將列表從小到大排序 n = len(numbers) mid = n // 2 # 求中間位置下標 if n % 2 == 0: # 如果數據的個數是偶數 return (numbers[mid-1] + numbers[mid]) / 2 else: # 如果數據的個數是奇數 return numbers[mid]
這種方法的時間複雜度為O(nlogn),因為它需要先對列表進行排序。
方法二:計數法
def median(numbers): freq_dict = {} # 創建一個字典 for x in numbers: freq_dict[x] = freq_dict.get(x, 0) + 1 # 統計每個數出現的次數 sorted_freq = sorted(freq_dict.items()) # 將字典按照鍵(即數值)排序 n = len(numbers) mid = n // 2 # 求中間位置下標 count = 0 if n % 2 == 0: # 如果數據的個數是偶數 for num, freq in sorted_freq: count += freq if count == mid: return (num + prev_num) / 2 elif count > mid: return num prev_num = num else: # 如果數據的個數是奇數 for num, freq in sorted_freq: count += freq if count > mid: return num
這種方法的時間複雜度為O(n),因為它只需要統計每個數出現的次數,並按照數值排序。
二、計算中位數的代碼示例
以下是一個計算中位數的完整代碼示例:
def median(numbers): freq_dict = {} # 創建一個字典 for x in numbers: freq_dict[x] = freq_dict.get(x, 0) + 1 # 統計每個數出現的次數 sorted_freq = sorted(freq_dict.items()) # 將字典按照鍵(即數值)排序 n = len(numbers) mid = n // 2 # 求中間位置下標 count = 0 if n % 2 == 0: # 如果數據的個數是偶數 for num, freq in sorted_freq: count += freq if count == mid: return (num + prev_num) / 2 elif count > mid: return num prev_num = num else: # 如果數據的個數是奇數 for num, freq in sorted_freq: count += freq if count > mid: return num } # 調用函數計算中位數 numbers = [1, 2, 3, 4, 5, 5, 7, 8, 9] print(median(numbers))
輸出結果為5。
三、總結
計算中位數在統計學和數據處理中是一個非常常見的操作。本文介紹了兩種計算中位數的方法:排序法和計數法。排序法的時間複雜度為O(nlogn),計數法的時間複雜度為O(n)。在實際的應用中,應該根據數據的大小、數據分布和性能要求等不同的因素來選擇合適的方法。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/249325.html