分位數回歸的詳細闡述

一、分位數回歸概念

分位數回歸是一種經濟學中廣泛使用的回歸方法，它是利用在各個分位數處的條件中位數函數建立的回歸模型。不同於普通最小二乘回歸只關注模型在均值附近的擬合情況，分位數回歸可以對中位數附近的數據和任意其他分位數情況下的數據進行分析。

在分位數回歸中，我們可以定義一個分位數q，利用最小化平均損失函數來確定各個分位數處的斜率係數，得到在該分位數下的條件中位數函數。

二、中位數回歸和分位數回歸的區別

中位數回歸的目的是擬合出數據的中位數，而分位數回歸可以擬合出在各個分位數的值。在中位數回歸中，我們利用最小化絕對誤差來尋找中位數；而在分位數回歸中，我們利用最小化平均損失函數來確定各個分位數處的斜率係數。

另外，中位數回歸有時可能被簡單誤解為只適用於二分類問題，而分位數回歸可以適用於多分類問題。

三、分位數回歸的意義

分位數回歸可以在斜率係數固定的情況下，比較不同分位數下的條件中位數差異，從而探究不同分位數下的變量對反應變量的影響程度。在經濟學中，我們可以用分位數回歸方法來探究收入分配問題、貧富差距等社會現象。

四、分位數回歸的方法

分位數回歸有多種方法，其中最為常用的是基於最小絕對誤差的條件中位數估計和基於最小平方的條件平均估計。

在基於最小絕對誤差的條件中位數估計中，我們利用L1範數來定義損失函數，得到了一個叫做LAD（Least Absolute Deviations）模型的分位數回歸模型。而基於最小平方誤差的條件平均估計，則是通過L2範數來定義損失函數，從而得到了一個叫做OLS（Ordinary Least Squares）的回歸模型。

import statsmodels.formula.api as smf

# 以0.1為分位數做分位數回歸
mod = smf.quantreg('y ~ x', df)
res = mod.fit(q=.1)
res.summary()

五、分位數回歸stata

在stata中可以使用qreg命令進行分位數回歸。該命令有一個可選參數q，它可以指定用於進行分位數回歸的分位數值。例如，我們可以利用下面的stata代碼進行0.1分位數回歸。

qreg y x, q(0.1)

六、分位數回歸通俗理解

假設有一個學生常數學不及格，您作為他的班主任，要想辦法找到一個對他有幫助的補習方法。於是您發現，他數學不及格的原因是因為他對於難度較高的題目較難掌握。因此，您決定採用分位數回歸的方法，分析難度係數對其成績的影響程度，從而找到一個最佳的補習方法。

七、分位數回歸通俗講解

分位數回歸是一種比普通的最小二乘回歸更貼近實際的回歸方法。在普通的最小二乘回歸中，我們只關注數據在均值附近的擬合情況，而對於任意其他分位數情況下的數據進行分析較為困難。

而在分位數回歸中，我們可以確定一個分位數q，從而對中位數附近的數據和其他分位數情況下的數據進行分析。這種方法可以更好地針對分布不均的數據進行建模和預測。

八、分位數回歸中什麼不可導

分位數回歸的代價函數並不是一個可導函數，因此我們在進行最小化平均損失函數的時候，不能使用梯度下降算法等基於導數的算法。而是需要採用類似線性規劃的方法進行求解。

九、分位數回歸r語言

在r語言中，我們可以使用quantreg包進行分位數回歸的擬合和結果輸出。下面是一個基於最小絕對誤差的條件中位數估計的r語言代碼示例。

library(quantreg)

# 以0.1為分位數做分位數回歸
mod <- rq(y ~ x, data=df, tau=0.1)
summary(mod)

十、分位數回歸模型公式

分位數回歸模型公式如下：

$$ median(y|x) = \alpha_0 + \alpha_1 x_1 + \alpha_2 x_2 + \cdots + \alpha_n x_n $$

其中，median(y|x)表示在變量x的某個分位數下y的中位數。

我們可以通過確定不同分位數q，來得到一系列對應於每個分位數的回歸係數$\alpha_0, \alpha_1, \alpha_2, \cdots, \alpha_n$。

原創文章，作者：小藍，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/251680.html