ASPP模塊詳解

ASPP(Atrous Spatial Pyramid Pooling)是一種用於圖像分割任務的模塊,旨在解決語義分割中空間上下文信息不足的問題。該模塊在多個深度學習框架中得到了廣泛的應用,如在DeepLab系列中發揮了關鍵作用。下面將從多個方面對ASPP模塊進行詳細的闡述。

一、ASPP模塊原理

ASPP模塊是基於空洞卷積(或稱孔卷積,dilated convolution)的思想。空洞卷積是一種可以在不增加網絡參數的情況下,增大感受野的技術,可以幫助模型獲取更大範圍的圖像信息。ASPP模塊採用多個空洞卷積,不同採樣率的空洞卷積可捕獲不同尺度的局部信息,最終得到具有不同感受野的特徵圖。下面是ASPP模塊的代碼實現:


import torch.nn as nn
import torch.nn.functional as F

class ASPP(nn.Module):
    def __init__(self, in_channels, out_channels, rates):
        super(ASPP, self).__init__()
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=1)
        self.conv2 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[0], dilation=rates[0])
        self.conv3 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[1], dilation=rates[1])
        self.conv4 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[2], dilation=rates[2])
        self.conv5 = nn.Conv2d(in_channels, out_channels, kernel_size=1)
        self.bn = nn.BatchNorm2d(out_channels)
        self.dropout = nn.Dropout(0.5)

    def forward(self, x):
        feat1 = self.conv1(x)
        feat2 = self.conv2(x)
        feat3 = self.conv3(x)
        feat4 = self.conv4(x)
        out = torch.cat((feat1, feat2, feat3, feat4), dim=1)
        out = self.bn(self.conv5(out))
        out = F.relu(out)
        out = self.dropout(out)
        return out

ASPP模塊實現了上述原理,使用四個不同採樣率(rates)的空洞卷積,之後對輸出進行合併,再通過一次卷積和BatchNorm層得到最終的輸出。該模塊中還加入了Dropout層防止過擬合。

二、多尺度ASPP模塊

為進一步提高模型的準確性,可以在ASPP模塊中引入多尺度的特徵圖。具體方法是在不同大小的特徵圖上分別使用ASPP模塊,之後將它們合併得到最終的輸出。多尺度ASPP模塊的代碼實現如下:


import torch

def ASPP_module(x, in_channels, out_channels, rates):
    feat1 = torch.nn.Conv2d(in_channels, out_channels, kernel_size=1)(x)
    feat2 = torch.nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[0], dilation=rates[0])(x)
    feat3 = torch.nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[1], dilation=rates[1])(x)
    feat4 = torch.nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[2], dilation=rates[2])(x)
    out = torch.cat((feat1, feat2, feat3, feat4), dim=1)
    out = torch.nn.BatchNorm2d(out_channels)(out)
    out = torch.nn.ReLU()(out)
    out = torch.nn.Dropout2d()(out)
    return out

class MultiScaleASPP(nn.Module):
    def __init__(self, in_channels, out_channels):
        super().__init__()
        rates = [1, 6, 12]
        self.aspp1 = ASPP_module(in_channels, out_channels, [1, 1, 1])
        self.aspp2 = ASPP_module(in_channels, out_channels, [6, 12, 18])
        self.aspp3 = ASPP_module(in_channels, out_channels, rates)
        self.global_avg_pool = nn.Sequential(
            nn.AdaptiveAvgPool2d((1, 1)),
            nn.Conv2d(in_channels, out_channels, 1, stride=1, bias=False),
            nn.BatchNorm2d(out_channels),
            nn.ReLU()
        )
        self.conv = nn.Conv2d(out_channels*4, out_channels, kernel_size=1, bias=False)
        self.bn = nn.BatchNorm2d(out_channels)
        self.dropout = nn.Dropout2d(p=0.1)

    def forward(self, x):
        feat1 = self.aspp1(x)
        feat2 = self.aspp2(x)
        feat3 = self.aspp3(x)
        global_avg_pool = self.global_avg_pool(x).expand(x.size()[0], -1, x.size()[2], x.size()[3])
        out = torch.cat([feat1, feat2, feat3, global_avg_pool], dim=1)
        out = self.conv(out)
        out = self.bn(out)
        out = torch.nn.ReLU()(out)
        out = self.dropout(out)
        return out

利用多尺度ASPP模塊,可以容易地在已有的ASPP模塊中實現定製化的模型結構。

三、ASPP模塊在DeepLab系列網絡中的應用

DeepLab是語義分割任務中的一類經典網絡,使用ASPP模塊在網絡中成功地解決了空間上下文信息不足問題,取得了較好的效果。下面以DeepLab-v3+網絡為例,說明ASPP模塊在其中的應用。該網絡在ImageNet數據集上預訓練,在PASCAL VOC、Cityscapes等數據集上微調。


import torch.nn as nn

class DeepLabv3(nn.Module):
    def __init__(self, backbone, classifier, aspp_dilate=[6,12,18]):
        super(DeepLabv3, self).__init__()
        self.backbone = backbone
        self.classifier = classifier
        self.aspp = MultiScaleASPP(in_channels=2048, out_channels=256)
        self.final_conv = nn.Conv2d(256, 256, kernel_size=1)
        self._init_weight()

    def forward(self, x):
        input_shape = x.shape[-2:]
        feature_map = self.backbone(x)
        feature_map = self.aspp(feature_map)
        feature_map = self.final_conv(feature_map)
        output = self.classifier(feature_map)
        output = F.interpolate(output, size=input_shape,
                               mode='bilinear', align_corners=False)
        return output

    def _init_weight(self):
        for m in self.modules():
            if isinstance(m, nn.Conv2d):
                nn.init.kaiming_normal_(m.weight)
                if m.bias is not None:
                    nn.init.zeros_(m.bias)
            elif isinstance(m, nn.BatchNorm2d):
                nn.init.ones_(m.weight)
                nn.init.zeros_(m.bias)

在DeepLabv3網絡中,ASPP模塊的輸出經過一次卷積和上採樣操作之後用於分類器進行預測。該網絡在PASCAL VOC數據集上取得了當時最優秀的性能。

四、ASPP模塊的優化

由於ASPP模塊經常被用於深度學習網絡的預測部分,而該部分常常需要對每個像素進行操作,因此ASPP模塊的計算量很大。為此,研究者嘗試減少ASPP模塊的計算量,提出了多種方法,如使用深度可分離卷積(depthwise separable convolution)等。下面是一種改進ASPP模塊的方法:


import torch.nn as nn

class GDASPP(nn.Module):
    def __init__(self, in_channels, out_channels, rates):
        super(GDASPP, self).__init__()
        self.conv1 = nn.Conv2d(in_channels, out_channels, kernel_size=1)
        self.conv2 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[0], dilation=rates[0], groups=out_channels)
        self.conv3 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[1], dilation=rates[1], groups=out_channels)
        self.conv4 = nn.Conv2d(in_channels, out_channels, kernel_size=3, padding=rates[2], dilation=rates[2], groups=out_channels)
        self.conv5 = nn.Conv2d(in_channels, out_channels, kernel_size=1)
        self.bn = nn.BatchNorm2d(out_channels)
        self.dropout = nn.Dropout2d(0.5)

    def forward(self, x):
        feat1 = self.conv1(x)
        feat2 = self.conv2(x)
        feat3 = self.conv3(x)
        feat4 = self.conv4(x)
        out = torch.cat((feat1, feat2, feat3, feat4), dim=1)
        out = self.bn(self.conv5(out))
        out = F.relu(out)
        out = self.dropout(out)
        return out

所述改進的ASPP模塊將普通卷積替換為深度可分離卷積,可以大大降低計算量,同時保持模型準確性。該模塊應用於DeepLabv3+中可以取得比原版ASPP模塊更好的結果。

至此,我們詳細地介紹了ASPP模塊及其應用。ASPP模塊在圖像分割任務中具有重要作用,值得廣大研究者深入研究。

原創文章,作者:小藍,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/236080.html

(0)
打賞 微信掃一掃 微信掃一掃 支付寶掃一掃 支付寶掃一掃
小藍的頭像小藍
上一篇 2024-12-12 11:57
下一篇 2024-12-12 11:57

相關推薦

  • 光模塊異常,SFP未認證(entityphysicalindex=6743835)——解決方案和

    如果您遇到類似optical module exception, sfp is not certified. (entityphysicalindex=6743835)的問題,那麼…

    編程 2025-04-29
  • Python模塊下載與安裝指南

    如果想要擴展Python的功能,可以使用Python模塊來實現。但是,在使用之前,需要先下載並安裝對應的模塊。本文將從以下多個方面對Python模塊下載與安裝進行詳細的闡述,包括使…

    編程 2025-04-29
  • Python編程三劍客——模塊、包、庫

    本文主要介紹Python編程三劍客:模塊、包、庫的概念、特點、用法,以及在實際編程中的實際應用,旨在幫助讀者更好地理解和應用Python編程。 一、模塊 1、概念:Python模塊…

    編程 2025-04-29
  • 如何使用pip安裝模塊

    pip作為Python默認的包管理系統,是安裝和管理Python包的一種方式,它可以輕鬆快捷地安裝、卸載和管理Python的擴展庫、模塊等。下面從幾個方面詳細介紹pip的使用方法。…

    編程 2025-04-28
  • Python如何下載第三方模塊

    想要使Python更加強大且具備跨平台性,我們可以下載許多第三方模塊。下面將從幾個方面詳細介紹如何下載第三方模塊。 一、使用pip下載第三方模塊 pip是Python的軟件包管理器…

    編程 2025-04-28
  • Python datetime和time模塊用法介紹

    本文將詳細闡述Python datetime和time模塊的用法和應用場景,以幫助讀者更好地理解和運用這兩個模塊。 一、datetime模塊 datetime模塊提供了處理日期和時…

    編程 2025-04-28
  • Idea創建模塊時下面沒有啟動類的解決方法

    本文將從以下幾個方面對Idea創建模塊時下面沒有啟動類進行詳細闡述: 一、創建SpringBoot項目時沒有啟動類的解決方法 在使用Idea創建SpringBoot項目時,有可能會…

    編程 2025-04-28
  • l9110風扇傳感器模塊原理圖解析

    本文將從原理圖概述、硬件特性、軟件實現等多個方面對l9110風扇傳感器模塊進行詳細解析,並給出對應代碼實例。 一、原理圖概述 l9110風扇傳感器模塊主要由驅動芯片l9110、電位…

    編程 2025-04-28
  • 掌握Python3中datetime模塊的使用

    Python3中的datetime模塊是處理日期和時間的常用模塊之一,它提供了一些函數和類,可以輕鬆處理日期和時間,包括日期和時間的計算、格式化、解析、時區轉換等。本文將從多個方面…

    編程 2025-04-28
  • Python導入模塊方法

    在Python編程中,模塊是管理函數和變量之類內容的一種方式。Python標準庫提供了許多有用的模塊,讓我們可以方便地實現對底層硬件和網絡等的控制。本文將介紹Python中常用的導…

    編程 2025-04-28

發表回復

登錄後才能評論