一、截斷正態分布的性質
截斷正態分布是指在正態分布的基礎上,將其限制在某個區間內。其特點是在限定的區間內密度函數不為0,在區間外部則密度函數為0。
與正態分布相似,截斷正態分布也具有對稱性、一峰性、鐘形曲線以及70-95-99.7規律等基本性質。同時,截斷正態分布也有從小到大趨於零、平均值等於中位數、方差能夠描述分布的分散程度等特性。
通過對分布區間的限制,截斷正態分布加強了對分布的控制,應用場景廣泛。
二、正態分布的獨立性判斷
對於兩個隨機變數x和y,若其相互獨立,則有P(x=a, y=b)=P(x=a)P(y=b)。通常情況下,我們將幾組數據繪製成散點圖,通過觀察散點圖的形狀,來判斷兩個隨機變數是否相互獨立。
但有時候,正態分布的方差越小,散點圖上的點越密集,相互獨立的判斷則更為困難。此時,我們可以採用Pearson相關係數或Spearman相關係數等方法進行判斷。
三、截斷正態分布的密度函數
對於一般的正態分布N(μ, σ^2),其密度函數為:
而對於截斷正態分布N(a, b|μ, σ^2),其密度函數為:
其中I(x)為指示函數,當x滿足條件時取值為1,否則為0。
四、截尾正態分布表達式
截尾正態分布與截斷正態分布類似,主要區別在於其密度函數在限定區間外依然有一定值,但值逐漸衰減。其密度函數為:
其中,$\Phi$為正態分布函數。
五、截斷正態分布的似然函數
對於一個截斷正態分布模型,若其隨機樣本為$x_1, x_2, …, x_n$,似然函數為:
我們的目標是求解最大化該函數的$\mu$和$\sigma$,從而確定該樣本的模型參數。
六、截斷正態分布的概率密度函數
截斷正態分布的概率密度函數是指在給定參數條件下的概率密度函數。對於一個截取區間為[a, b]的截斷正態分布,其概率密度函數為:
其中,$\phi(x)$和$\Phi(x)$分別為標準正態分布的概率密度函數和分布函數。
七、截斷正態分布圖像
import numpy as np from scipy.stats import truncnorm import matplotlib.pyplot as plt a, b = 20, 60 mu, sigma = 40, 10 x = np.linspace(mu - 4*sigma, mu + 4*sigma, 100) plt.plot(x, truncnorm.pdf(x, (a - mu)/sigma, (b - mu)/sigma, loc=mu, scale=sigma), 'r-', lw=5, alpha=0.6, label='truncnorm pdf') plt.legend(loc='best', frameon=False) plt.show()
八、截斷正態分布密度函數
import numpy as np from scipy.stats import truncnorm a, b = 20, 60 mu, sigma = 40, 10 pdf = truncnorm.pdf(np.linspace(mu - 4*sigma, mu + 4*sigma, 100), (a - mu)/sigma, (b - mu)/sigma, loc=mu, scale=sigma) print("pdf:", pdf)
九、截斷正態分布張量的函數
import tensorflow as tf from tensorflow_probability import distributions as tfd a, b = 20, 60 mu, sigma = 40, 10 tfd_truncnorm = tfd.TruncatedNormal(loc=mu, scale=sigma, low=a, high=b) print("mean:", tf.constant(mu)) print("mode:", tfd_truncnorm.mode()) print("variance:", tf.square(sigma))
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/201119.html