Smooth L1

一、簡介

Smooth L1是一種常用的損失函數，主要用於物體檢測和目標跟蹤等計算機視覺任務。相比於其他常用的損失函數，如均方誤差（MSE）和絕對誤差（L1），Smooth L1具有更好的平滑性和魯棒性，有效地緩解了樣本中的異常值對損失函數的影響。

Smooth L1的公式如下：

   L_{smooth L1}(x) = \begin{cases} 
   0.5x^2 & if  \left| x \right| <1 \\
   \left| x \right| - 0.5 & otherwise
   \end{cases}

其中x是預測值和真實值之間的差距。

二、平滑性

平滑性是指損失函數在接近最小值時的平滑性和連續性。相比於MSE和L1，Smooth L1的導數在絕大部分區間內具有連續性，在此之外也有平滑過渡，不會像MSE那樣出現突變。因此，Smooth L1在訓練過程中更加穩定，收斂速度更快，對離群點的魯棒性也更好。

Smooth L1和L1損失函數的比較：

import torch.nn.functional as F
import torch

loss_fn = F.smooth_l1_loss
l1_fn = F.l1_loss

# 構造預測值和真實值
y_pred = torch.tensor([[0.5, 0.2, 0.1, 0.3], [0.1, 0.6, 0.2, 0.4], [0.3, 0.4, 0.7, 0.1]])
y_true = torch.tensor([[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0]])

# 計算Smooth L1損失函數
loss = loss_fn(y_pred, y_true)
print(loss)

# 計算L1損失函數
l1_loss = l1_fn(y_pred, y_true)
print(l1_loss)

輸出結果為：

tensor(0.4000)
tensor(0.5250)

可以看出，當Smooth L1函數的x小於1時，其損失值比L1小，這也說明了Smooth L1比L1更具平滑性。

三、魯棒性

魯棒性是指損失函數對異常樣本的適應能力。在物體檢測等任務中，可能會出現一些異常樣本，如噪聲、異常形狀等。這時，L1損失函數會受到很大影響，而Smooth L1就能夠更好地適應這些異常樣本，從而使模型更加健壯。

Smooth L1對魯棒性的影響：

import torch.nn.functional as F
import torch

# 構造帶有噪聲的預測值和真實值
y_pred = torch.tensor([[0.5, 0.2, 0.1, 0.3], [0.1, 0.6, 0.2, 0.4], [0.3, 0.4, 0.7, 0.1]])
y_true = torch.tensor([[1, 0, 0, 0], [0, 1, 0, 0], [0, 0, 1, 0]])
noisy_pred = y_pred + torch.randn(y_pred.size()) * 0.5

# 計算Smooth L1損失函數
loss = F.smooth_l1_loss(noisy_pred, y_true)
print(loss)

# 計算L1損失函數
l1_loss = F.l1_loss(noisy_pred, y_true)
print(l1_loss)

輸出結果為：

tensor(0.6225)
tensor(1.0883)

可以看出，Smooth L1損失函數對帶有噪聲的預測值的影響比L1小，說明其具有更好的魯棒性。

四、使用Smooth L1損失函數進行目標檢測

在目標檢測任務中，Smooth L1通常被用作回歸分支的損失函數。以Faster R-CNN為例：

import torch.nn.functional as F
import torch

class FastRCNNLoss(nn.Module):
    def __init__(self):
        super(FastRCNNLoss, self).__init__()

    def forward(self, cls_score, bbox_pred, labels, bbox_targets):

        # 計算分類損失
        cls_loss = F.cross_entropy(cls_score, labels)

        # 計算回歸損失
        bbox_loss = F.smooth_l1_loss(bbox_pred, bbox_targets)

        # 計算總損失
        loss = cls_loss + bbox_loss

        return loss

其中，cls_score和labels分別是預測分類得分和真實標籤，bbox_pred和bbox_targets分別是預測的邊界框和真實邊界框。通過計算分類損失和回歸損失的和，得到總損失。

五、小結

Smooth L1是一種常用的損失函數，在計算機視覺任務中有着廣泛的應用。相比於其他常用的損失函數，Smooth L1具有更好的平滑性和魯棒性，對模型的訓練和預測都有很好的效果。在實際應用中，我們可以根據具體任務和數據情況選擇合適的損失函數，並結合模型和優化算法進行優化，提高模型的性能。

原創文章，作者：GFGPA，如若轉載，請註明出處：https://www.506064.com/zh-hant/n/372906.html