Python編程實現中位數計算方法詳解

在統計學中，中位數是指將一組數據按照從小到大（或從大到小）的順序排列，處於中間位置的那個數。如果數據的個數是奇數，則中位數是這組數據中間那個數；如果數據的個數是偶數，則中位數是中間兩個數的平均數。

一、計算中位數的演算法

計算中位數的演算法有多種。以下是兩種常用方法：

方法一：排序法

def median(numbers):
    numbers.sort()              # 將列表從小到大排序
    n = len(numbers)
    mid = n // 2                # 求中間位置下標
    if n % 2 == 0:              # 如果數據的個數是偶數
        return (numbers[mid-1] + numbers[mid]) / 2
    else:                       # 如果數據的個數是奇數
        return numbers[mid]

這種方法的時間複雜度為O(nlogn)，因為它需要先對列表進行排序。

方法二：計數法

def median(numbers):
    freq_dict = {}              # 創建一個字典
    for x in numbers:
        freq_dict[x] = freq_dict.get(x, 0) + 1  # 統計每個數出現的次數
    sorted_freq = sorted(freq_dict.items())   # 將字典按照鍵（即數值）排序
    n = len(numbers)
    mid = n // 2                # 求中間位置下標
    count = 0
    if n % 2 == 0:              # 如果數據的個數是偶數
        for num, freq in sorted_freq:
            count += freq
            if count == mid:
                return (num + prev_num) / 2
            elif count > mid:
                return num
            prev_num = num
    else:                       # 如果數據的個數是奇數
        for num, freq in sorted_freq:
            count += freq
            if count > mid:
                return num

這種方法的時間複雜度為O(n)，因為它只需要統計每個數出現的次數，並按照數值排序。

二、計算中位數的代碼示例

以下是一個計算中位數的完整代碼示例：

def median(numbers):
    freq_dict = {}              # 創建一個字典
    for x in numbers:
        freq_dict[x] = freq_dict.get(x, 0) + 1  # 統計每個數出現的次數
    sorted_freq = sorted(freq_dict.items())   # 將字典按照鍵（即數值）排序
    n = len(numbers)
    mid = n // 2                # 求中間位置下標
    count = 0
    if n % 2 == 0:              # 如果數據的個數是偶數
        for num, freq in sorted_freq:
            count += freq
            if count == mid:
                return (num + prev_num) / 2
            elif count > mid:
                return num
            prev_num = num
    else:                       # 如果數據的個數是奇數
        for num, freq in sorted_freq:
            count += freq
            if count > mid:
                return num
}

# 調用函數計算中位數
numbers = [1, 2, 3, 4, 5, 5, 7, 8, 9]
print(median(numbers))

輸出結果為5。

三、總結

計算中位數在統計學和數據處理中是一個非常常見的操作。本文介紹了兩種計算中位數的方法：排序法和計數法。排序法的時間複雜度為O(nlogn)，計數法的時間複雜度為O(n)。在實際的應用中，應該根據數據的大小、數據分布和性能要求等不同的因素來選擇合適的方法。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/249325.html