一、Pears是什麼意思?
Pears是一種水果,通常呈梨形或圓形,具有白色果肉和綠色或黃色外皮。然而,當我們談論Pearson’s r時,我們實際上正在談論一種用于衡量兩個變數之間關係的統計方法。它可以告訴我們這兩個變數之間的關係是否為正相關、負相關或不相關。
二、Pearson是什麼意思?
Pearson是Karl Pearson的姓氏,他是19世紀末和20世紀初英國的一位統計學家。他發明了Pearson’s r這一統計方法。Pearson’s r也被稱為Pearson相關係數或Pearson積矩相關係數。它是指從兩個樣本中計算出的一個值,可以用于衡量兩個變數之間的線性關係程度。
三、Pearson’s r的定義
Pearson’s r是一種統計方法,用于衡量兩個變數之間的線性關係程度。它定義為兩個變數之間的協方差除以它們各自標準差的乘積。
def pearson_r(x, y):
"""
計算兩個變數之間的Pearson's r
x: 變數1的值列表
y: 變數2的值列表
返回兩個變數之間的Pearson's r
"""
n = len(x)
mean_x = sum(x) / n
mean_y = sum(y) / n
cov_xy = sum((x[i] - mean_x) * (y[i] - mean_y) for i in range(n))
std_x = (sum((x[i] - mean_x)**2 for i in range(n)) / n) ** 0.5
std_y = (sum((y[i] - mean_y)**2 for i in range(n)) / n) ** 0.5
return cov_xy / (std_x * std_y)
四、Pearson’s r的應用
Pearson’s r可以應用於很多領域,例如金融、醫學和社會科學等。在金融領域,它可以用于衡量股票收益和指數收益之間的相關性。在醫學領域,它可以用於研究藥物療效和副作用之間的關係。在社會科學領域,它可以用於分析家庭收入和教育程度之間的關係。在Python中,我們可以使用pandas和numpy模塊計算兩個變數之間的Pearson’s r。
import pandas as pd
import numpy as np
# 讀取數據
data = pd.read_csv('data.csv')
# 計算Pearson's r
corr, _ = np.corrcoef(data['x'], data['y'])
print('Pearson\'s r:', corr)
五、總結
Pearson’s r是一種用于衡量兩個變數之間關係的統計方法。它定義為兩個變數之間的協方差除以它們各自標準差的乘積。它可以應用於很多領域,包括金融、醫學和社會科學等。在Python中,我們可以使用pandas和numpy模塊計算兩個變數之間的Pearson’s r。
原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/259740.html
微信掃一掃
支付寶掃一掃