本文將從以下幾個方面介紹符號秩檢驗和秩和檢驗的比較,包括定義、假設條件、檢驗統計量、顯著性水平等。
一、定義
符號秩檢驗和秩和檢驗都是非參數的假設檢驗方法,適用於兩組獨立樣本比較差異。
符號秩檢驗是對兩組樣本中的差值進行符號化處理,將正差值和負差值分別用「+」和「-」表示,並計算正差值的符號秩和、負差值的符號秩和及絕對值的綜合秩和。再將這三個檢驗統計量與各自的分佈進行比較,以判斷兩組樣本的差異性。
from scipy.stats import wilcoxon statistic, pvalue = wilcoxon(x, y) print(statistic, pvalue)
其中x和y為兩組獨立樣本,返回結果為統計量和p值。
秩和檢驗則是將兩組樣本的全部觀測值按大小順序排列,並將排序後的秩次分別賦給每組樣本中的相應觀測值。再計算兩組排名和的差值,以及檢驗統計量和分佈,判斷兩組樣本的差異性。
from scipy.stats import mannwhitneyu statistic, pvalue = mannwhitneyu(x, y) print(statistic, pvalue)
其中x和y為兩組獨立樣本,返回結果為統計量和p值。
二、假設條件
符號秩檢驗與秩和檢驗都要求樣本獨立,且來自於對稱分佈或近似於對稱分佈的總體。但符號秩檢驗還有另外一個限制條件是樣本量不能太小,否則得到的p值偏大。
三、檢驗統計量
符號秩檢驗的檢驗統計量為正、負差值的符號秩和與絕對值的符號秩和。其中,絕對值的符號秩和只考慮兩組樣本的絕對值差異,而不是方向差異。
秩和檢驗的檢驗統計量為兩組秩次之和的差值。該統計量的大小代表了兩組樣本之間的差異性。
四、顯著性水平
在常見的顯著性水平下(如0.05、0.01),符號秩檢驗和秩和檢驗的拒絕域是不同的。符號秩檢驗的拒絕域是左右對稱的,秩和檢驗的拒絕域則是右側有限,相對於符號秩檢驗的拒絕域更加寬鬆。
由於極端值的影響,符號秩檢驗的p值更加保守,而秩和檢驗的p值相對更小。
五、代碼示例
下面是符號秩檢驗和秩和檢驗的代碼示例:
from scipy.stats import wilcoxon, mannwhitneyu # 符號秩檢驗 statistic, pvalue = wilcoxon(x, y) print('符號秩檢驗:') print('statistic:', statistic) print('pvalue:', pvalue) # 秩和檢驗 statistic, pvalue = mannwhitneyu(x, y) print('秩和檢驗:') print('statistic:', statistic) print('pvalue:', pvalue)
以上代碼可用於Python中進行符號秩檢驗和秩和檢驗。
原創文章,作者:RCSML,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/373792.html