摘 要: 針對傳統的局部線性嵌入演算法易受近鄰點個數的影響,以及支持向量機的錯分點過多對識別率產生的影響,提出了一種基於模糊聚類的局部線性嵌入和支持向量機的人臉識別方法。利用改進的演算法對人臉庫中的圖像進行特徵提取,然後採用支持向量機分類器對人臉進行訓練和識別。實驗表明,該方法提高了人臉的識別率。
0 引言
人臉識別[1-3]是基於人的臉部特徵信息進行身份識別的一種技術,它屬於生物特徵識別技術,是根據生物體(一般特指人)本身的生物特徵來區分生物體個體。人臉識別基於人的臉部特徵,對輸入的人臉圖像進行分析、學習,從而完成識別。該技術被廣泛用於政府、軍隊、銀行、社會福利保障、電子商務、安全防務等多個領域。
人臉識別是一個複雜的過程,其關鍵在於特徵提取和識別,近年來建立在統計學理論基礎上的支持向量機(Support Vector Machine,SVM)[4-7]方法逐漸被認可,由於其具有良好的概括能力,因而被應用於人臉識別。但是,由於人臉數據維數龐大,導致分類演算法過於複雜,致使錯分點增加,從而影響識別的效果。局部線性嵌入(Locally Linear Embedding,LLE)[8-9]演算法是一種基於流形學習的非線性降維演算法,可以用來進行特徵提取,但是該演算法容易受到近鄰點選取的影響;參考文獻[10]提出了一種改進的局部線性嵌入演算法(CLLE)[11-15],在LLE的基礎上構造近似重構係數,能夠很好地對重構誤差加以約束。
因此,本文在參考文獻[10]的基礎上提出一種基於CLLE和SVM的人臉識別方法,對預處理好的人臉圖像利用CLLE進行特徵提取,在低維空間中採用SVM進行學習訓練和識別樣本數據,此方法的識別率相比於已有方法有所提高,從實驗中可以得到證實。
1 基於模糊聚類的LLE
對於給定的高維觀測數據集X={x1,x2,…,xN},xi∈RD,採樣自d維流形,求低維坐Y={y1,y2,…,yN}。設樣本點聚類分類的類別個數為C,mj為第j類樣本的中心, n(j)為第j類樣本的個數。則第j類樣本點的內部平均距離為:
第j類樣本與總體樣本中心的距離為:
其中,m為總體樣本的中心。
由此,定義樣本點重構誤差的近似重構其中,j為樣本點i所屬的類,j=1,2,…,C。
演算法基本步驟如下[10]:
(1)選取近鄰點。對給定的數據集X={x1,x2,…,xN},利用歐式距離找到每個樣本點xi的k(k<N)個近鄰點。
(2)重建權值矩陣。使數據點的重建誤差最小,即求最優化問題:
其中,xij(j=1,2,…,k)為xi的k個近鄰點,wij是xi與xij之間的權值。
(3)由數據點的局部重建矩陣尋找低維嵌入Y。引入近似重構係數,求解:
其中,M=(I-W)T(I-W)。
輸出(S1/2)TMS1/2的2~(d+1)個非零特徵值對應的特徵向量。
2 SVM
SVM是以統計學習理論為基礎的一種機器學習演算法,能夠很好地解決小樣本、非線性問題。SVM的主要思想是用非線性映射?准將數據映射到高維特徵空間中,在高維特徵空間中利用最大間隔超平面對線性不可分的數據進行線性劃分操作,從而達到分類的效果。
SVM基本流程如下:
(1)將Tr={(x1,y1),(x2,y2),…,(xl,yl)}∈(X,Y)l作為訓練集,其中,xi∈X=Rl是每一個訓練樣本點,yi∈Y∈{-1,1}是訓練集中樣本點的類別,i=1,2,…,l。
(2)利用恰當的核函數K(xi,xj)和懲罰參數C進行高維映射,求解最優化問題:
由此判斷測試集類別。
3 基於模糊聚類LLE和SVM的人臉識別的基本步驟
本文演算法的具體步驟如下:
(1)圖像預處理;
(2)讀入樣本訓練集;
(3)利用改進的LLE演算法對圖像進行降維,提取樣本集的特徵;
(4)利用SVM對訓練集樣本進行學習,識別測試集樣本。
4 人臉特徵提取
4.1 實驗準備
實驗中用到的人臉圖像從ORL人臉資料庫中選取。該數據共有40個人,每個人有10幅圖像,分別具有不同的表情,共有400張圖像。實驗選取每個人的前5張圖像作為訓練集,共有200張圖像,共分為40類。剩餘的圖像作為實驗的測試集。部分人臉圖像如圖1所示。
4.2人臉特徵提取
為了能夠清楚地對比人臉特徵提取方法,從ORL人臉資料庫中選取5個人的圖像,分為5類,每個人10張圖像。每一個點代表一幅人臉圖像,降至2維。圖2為LLE演算法和改進演算法CLLE在領域數K=15時的降維效果圖。
從圖2可以看出,CLLE演算法將人臉數據降至2維後,不同的人已經可以被明顯地區分開來,而LLE演算法效果則不明顯。
當K=11時, LLE演算法和CLLE演算法的降維效果對比如圖3所示。可以看出,CLLE演算法已經可以對人臉數據進行很好的分類,效果十分明顯,而LLE演算法取得的效果則稍稍比K=15時略好一點。
從實驗結果可以看出,LLE演算法易受鄰域數K的影響,而對於K的不同取值,CLLE演算法卻可以普遍取得好的效果。
5 人臉識別
5.1 演算法參數的選取
5.1.1 核函數的選取
核函數的選取決定了學習分類的好壞。常用核函數主要有線性核函數、多項式核函數、徑向基核函數以及Sigmoid核函數。使用這4種核函數對人臉數據進行分類識別,結果如表1所示。易知對於實驗的人臉數據,在線性核函數下分類的準確率最高。
5.1.2 鄰域個數的選取
在選取聚類個數C時,若選取太大,會影響實驗的運行時間,因此實驗選取C=6,並利用CLLE演算法將人臉數據降至60維,進行訓練測試。不同鄰域數的分類準確率如表2所示。由表2可知,當聚類個數為6、鄰域個數為5時分類識別率略高一些。
5.2 不同分類方法對識別率的影響
表3為4種分類方法在人臉識別上的應用效果。
表3表明,CLLE-SVM演算法在人臉識別中優於其他三種演算法,人臉識別率可達到89.5%。
6 結論
本文利用基於模糊聚類的LLE演算法對人臉數據進行降維,在低維空間中利用SVM訓練學習已知樣本,從而識別人臉類別。實驗表明,該方法得到的人臉識別率相對於已有方法有了顯著的提高,從而證實了其有效性和可行性。
參考文獻
[1] Wang Jing, Su Guangda, Xiong Ying, et al. Sparse representation for face recognition based on constraint sampling and face alignment[J]. 清華大學學報(自然科學英文版), 2013 (1):62-67.
[2] BRUNELLI R, POGGIC T. Face recognition: features ve- rsus templates[J]. IEEE Transactions on PAMI, 1993,10 (15),1042-1052.
[3] CHELLAPPA R, WISLSON C L, SIROHEY S. Human and machine recognition of faces: a survey[C]. Proceedings of the IEEE, 1995,83(5), 705-741.
[4] VAPNIK V N.統計學習理論的本質[M].張學工,譯.北京:清華大學出版社,2000.
[5] 李芳.支持向量機在TE過程故障診斷中的應用[J].安徽工業大學學報(自然科學版),2010,27(2):195-199.
[6] 丁嬌,梁棟,閻慶.基於WLLE和SVM的植物葉片圖像識別方法[J].安徽大學學報(自然科學版),2013,37(4):61-67.
[7] CHANG K P, TEA J K. Objective rating of seam pucker using neural networks[J]. Textile Research Journal, 1997,67(7):494-502.
[8] ROWEIS S T, SAUL L K. Nonlinear dimensionality reduction by locally linear embedding[J]. Science, 2000, 290(5500):2323-2326.
[9] SAUL L K, ROWEIS S T. Think globally, fit locally: unsupervised learning of low dimensional manifolds [J]. Journal of Machine Learning Research, 2003,4(12):119-155.
[10] 吳曉婷,閆德勤.改進的非線性數據降維方法及其應用[J].計算機工程與應用,2011,47(2):156-159.
[11] 李新社,姚俊平.模糊聚類分析及其應用研究[J].網路安全技術與應用,2014(1):69-70.
[12] 王和勇,鄭傑,姚正安,等.基於聚類和改進距離的LLE方法在數據降維中的應用[J].計算機研究與發展,2006,43(8):1485-1490.
[13] THEODORIDIS S, KOUTROUMBAS K.模式識別(第3版)[M].李晶嬌,王愛俠,張廣源,譯.北京:電子工業出版社,2006.
[14] 王元珍,王健李,李晨陽.一種改進模糊聚類演算法[J].華中科技大學學報,2005,33(2):92-94.
[15] BEZDEK J C. Pattern recognition with fuzzy objective function algorithms [M].New York: Plenum Press, 1981.
原創文章,作者:投稿專員,如若轉載,請註明出處:https://www.506064.com/zh-tw/n/221464.html