針對實際監控中人體目標輪廓的多尺度特性,提出一種用於人體目標檢測的多尺度方向特徵描述子(HOGG)。首先採用Gabor濾波器提取人體圖像對應不同尺度、不同方向的多個Gabor幅值域圖譜,然後將相同尺度不同方向的幅值域圖譜融合以降低特徵維數,並對每幅融合圖像提取梯度方向直方圖(HOG)特徵,最後將這些HOG特徵聯合起來作為人體圖像表徵。利用支持向量機(SVM)對描述特徵進行分類,在CAVIAR數據庫中進行了實驗,結果表明,該算法對人體目標檢測具有較好的性能。
人體檢測被廣泛地用於計算機視覺領域,如公共安全、智能機器人、視覺監控、行為分析等[1]。目前人體檢測多採用基於統計分類的方法,常用Gabor小波變換和Haar小波變換提取人體特徵。DALAL N[2]等人提出梯度直方圖(Histograms of Oriented Gradient,HOG),利用圖像塊內的方向統計進行人體檢測,對解決局部形變與視角變化等問題,該檢測算法具有較高的精度。Mu Yadong[3]等人將局部二值模式(Local Binary Patterns,LBP)作為人體特徵描述算子,具有旋轉不變性和光照不變性,是一種有效的描述特徵。Wang Xiaoyu[4]等人提出了HOG與LBP相結合的算法,達到兩種特徵互補的效果,對解決人體檢測中部分遮擋問題有顯著的提高。
上述輪廓特徵一般都是在固定尺度上計算,沒有考慮實際監控中複雜背景下人體目標輪廓的多尺度特性,當這些算法應用到真實場景中時,其性能會急劇下降。本文提出一種Gabor變換與HOG特徵相結合的人體檢測算法(簡稱HOGG),利用Gabor變換多方向多尺度的特性,增強了人體的輪廓信息。該方法首先對圖像進行規一化處理,然後使用Gabor濾波器提取圖像多尺度、多方向的幅值域圖譜,並將同尺度不同方向幅值域圖譜融合以降低特徵維數,最後按順序提取各個尺度上融合圖譜的HOG特徵,串接組成整幅圖像的描述特徵。在CAVIAR數據庫下的大量實驗表明,該方法能較好地提取人體描述特徵,有較高的檢測率。
在提取人體Gabor特徵之前需要對圖像進行規一化處理,本文實驗中所用人體圖像為灰度圖像,大小為32×64像素。為了獲取多尺度的Gabor特徵,選取5個尺度和8個方向的Gabor濾波器組,則一幅人體圖像的多尺度、多方向特徵表示為:
通過Gabor變換後,每幅圖像會轉化成40個不同尺度與方向的圖像,特徵維數為原圖像的40倍,造成特徵數據冗餘,增加了計算的複雜度。本文將Gabor特徵同一尺度不同方向的特徵進行融合,有效地降低了Gabor特徵間的數據冗餘,保持了有效的決策信息,並可以對人體圖像進行多尺度分析。
2HOGG描述子
本文對融合圖像進一步提取HOG特徵,並將其聯合起來作為人體圖像的HOGG表徵。HOGG的構建過程主要分為以下幾個步驟:
(1)計算梯度幅值和方向
利用一階模板算子(-1,0,1)分別從橫向和縱向對融合圖像進行梯度提取操作,求得融合圖像的梯度圖像。
(2)構建梯度方向直方圖
把梯度圖像分成同等大小的正方形小塊(block),這些小塊是相互重疊的並且每個小塊被分為更小的正方形單元(cell,n×n像素)。利用梯度幅值和梯度方向在每個單元中進行直方圖投票,其中梯度方向作為直方圖投票區間,而梯度幅值作為直方圖投票權重,這樣對於每個小塊(block)都能得到一個維度為m×m×b的直方圖向量。
(3)梯度強度歸一化
以block為單位進行L2norm標準化,減少局部光照以及前景、背景對比度的變化對直方圖特徵的影響。設vn是對應的block向量,則標準化的向量fn為:
其中:ξ為接近0的正數。
(4)形成特徵向量
把一幅融合圖像的所有塊中的HOG特徵連接起來就得到了該融合圖像的HOG特徵。再將各尺度融合圖像的HOG順接起來作為一幅人體圖像的HOGG描述子。
3實驗分析
3.1實驗環境與數據庫
在Core(TM)2.00 GHz的CPU,2.00 GB內存,Windows下MATLAB R2010a的計算機上進行仿真實驗。實驗採用MIT和INRIA數據庫作為訓練集,包括1 126個正樣本與1 218個負樣本;採用CAVIAR[5]數據庫作為測試集。
3.2實驗步驟
本文採用滑動窗口方式獲取檢測窗口,用HOGG描述子對檢測窗口進行描述,再利用支持向量機[6]進行判別。由於在檢測過程中,對同一個人體進行多重檢測會直接導致計算效率下降。為此,本文將檢測窗口從大到小進行遍歷。在遍歷過程中,如果待測區域已經被標記為人體,則跳過該區域。
3.3實驗結果與分析
Gabor能對圖像進行多尺度、多方向的分解,實驗首先研究不同尺度數對檢測算法的影響。從CAVIAR四個序列中各隨機選取200張圖片作為測試集。實驗結果如表1所示。

實驗中採用綜合評價指標(F1measure,F)[7]評估算法的性能,其中:precision為準確率,recall為查全率;tp表示被正確檢測人數,fp表示錯誤檢測的人數,fn表示漏檢的人數。
由於不同尺度子帶間冗餘信息較大,簡單地增加尺度數不一定能提高性能,由表1可以看出,取尺度數為4效果最佳。
為了進一步驗證本文提出的算法,選取Gabor尺度為4,在CAVIAR行人數據庫上提取HOGG特徵,參照文獻[4]與HOG、LBP+HOG算法做了對比實驗,如表2所示。
從圖1可以看出,本文算法的Fmeasure優於當前其他方法,具有較好的性能,證明了HOGG方法的有效性。

4結論
本文提出了一種基於Gabor變換和HOG的人體目標檢測的新特徵表達,可以多層次、多分辨率地表徵人體目標。在CAVIAR數據庫中的實驗數據表明,Gabor多尺度的變換能夠增強HOG算子對人體紋理細節特徵和全局特徵的表示能力,有效地提高了人體檢測的性能。
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-hant/n/225122.html
微信掃一掃
支付寶掃一掃