如何用Python統計列表中各數據的方差和標準差

本文將從多個方面闡述如何使用Python統計列表中各數據的方差和標準差, 並給出詳細的代碼示例。

一、什麼是方差和標準差

方差是衡量數據變異程度的統計指標，它是每個數據值和該數據值平均數之差的平方的平均值。而標準差則是方差的平方根，表示數據偏離均值的程度，標準差越大，表示數據離散程度越大。

二、使用Python庫numpy進行方差和標準差計算

NumPy是Python科學計算的核心庫之一，它提供了許多高效的操作數組的函數和方法，可以方便地進行方差和標準差的計算。以下是一個簡單的示例：

import numpy as np

lst = [1, 2, 3, 4, 5]
arr = np.array(lst)

variance = np.var(arr)
standard_deviation = np.std(arr)

print("方差為：", variance)
print("標準差為：", standard_deviation)

三、手寫Python代碼進行方差和標準差計算

如果您想手寫Python代碼計算方差和標準差，也是可以的。以下是手寫代碼的示例：

def variance(data):
    """計算方差"""
    n = len(data)
    mean = sum(data) / n
    deviations = [(x - mean) ** 2 for x in data]
    variance = sum(deviations) / (n - 1)
    return variance

def standard_deviation(variance):
    """計算標準差"""
    return variance ** 0.5

lst = [1, 2, 3, 4, 5]
var = variance(lst)
std = standard_deviation(var)

print("方差為：", var)
print("標準差為：", std)

四、處理大數據集時的方差和標準差計算

當數據集非常大時，計算方差的公式可能會導致計算機運行緩慢，或甚至崩潰。一種解決方案是使用Welford方法，它是一種遞歸演算法，能夠通過一次遍歷整個數據集來計算方差。

def streaming_variance(data):
    """Welford's online algorithm"""
    n = 0
    mean = 0
    M2 = 0
 
    for x in data:
        n += 1
        delta = x - mean
        mean += delta / n
        M2 += delta * (x - mean)
 
    if n < 2:
        return float('nan')
    else:
        variance = M2 / (n - 1)
        return variance

lst = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]
var = streaming_variance(lst)
std = standard_deviation(var)

print("方差為：", var)
print("標準差為：", std)

五、總結

本文從不同的角度闡述了如何使用Python統計列表中各數據的方差和標準差。如果您想更快地處理大數據集，也可以嘗試使用Welford方法。希望本文能夠對您有所幫助。

原創文章，作者：CWYBN，如若轉載，請註明出處：https://www.506064.com/zh-tw/n/375484.html