本文目錄一覽:
- 1、win配置faster rcnn時,python setup.py install命令一直報錯,已嘗試多種方法仍沒有效果,求大神解決?!
- 2、如何評價rcnn,fast-rcnn和faster-rcnn這一系列方法
- 3、高大上的YOLOV3對象檢測算法,使用python也可輕鬆實現
win配置faster rcnn時,python setup.py install命令一直報錯,已嘗試多種方法仍沒有效果,求大神解決?!
你的vs安裝了相應的c語言sdk嗎
就是最下面說的那個頭文件stdbool沒找到,你看看是哪個sdk才有相應的頭文件呢
如何評價rcnn,fast-rcnn和faster-rcnn這一系列方法
RCNN:RCNN可以看作是RegionProposal+CNN這一框架的開山之作,在imgenet/voc/mscoco上基本上所有top的方法都是這個框架,可見其影響之大。RCNN的主要缺點是重複計算,後來MSRA的kaiming組的SPPNET做了相應的加速。
Fast-RCNN:RCNN的加速版本,在我看來,這不僅僅是一個加速版本,其優點還包括:
(a) 首先,它提供了在caffe的框架下,如何定義自己的層/參數/結構的範例,這個範例的一個重要的應用是python layer的應用,我在這裡支持多label的caffe,有比較好的實現嗎? – 孔濤的回答也提到了。
(2) training and testing end-to-end 這一點很重要,為了達到這一點其定義了ROIPooling層,因為有了這個,使得訓練效果提升不少。
高大上的YOLOV3對象檢測算法,使用python也可輕鬆實現
繼續我們的目標檢測算法的分享,前期我們介紹了SSD目標檢測算法的python實現以及Faster-RCNN目標檢測算法的python實現以及yolo目標檢測算法的darknet的window環境安裝,本期我們簡單介紹一下如何使用python來進行YOLOV3的對象檢測算法
YOLOV3的基礎知識大家可以參考往期文章,本期重點介紹如何使用python來實現
1、初始化模型
14-16 行:
模型的初始化依然使用cv下的DNN模型來加載模型,需要注意的是CV的版本需要大於3.4.2
5-8行:
初始化模型在coco上的label以便後期圖片識別使用
10-12行:
初始化圖片顯示方框的顏色
2、加載圖片,進行圖片識別
輸入識別的圖片進行圖片識別,這部分代碼跟往期的SSD 以及RCNN目標檢測算法類似
19-20行:輸入圖片,獲取圖片的長度與寬度
25-29行:計算圖片的blob值,輸入神經網絡,進行前向反饋預測圖片
只不過net.forward裏面是ln, 神經網絡的所有out層
3、遍歷所有的out層,獲取檢測圖片的label與置信度
遍歷out層,獲取檢測到的label值以及置信度,檢測到這裡YOLOV3以及把所有的檢測計算完成,但是由於yolov3對重疊圖片或者靠的比較近的圖片檢測存在一定的問題,使用YOLOV3使用非最大值抑制來抑制弱的重疊邊界
竟然把墨鏡識別了手機,體現了YOLOV3在重疊圖片識別的缺點
4、應用非最大值抑制來抑制弱的重疊邊界,顯示圖片
56: 使用 非最大值抑制來抑制弱的重疊邊界
58-59行:遍歷所有圖片
61-62行:提取檢測圖片的BOX
64-68行:顯示圖片信息
70-71行:顯示圖片
利用python來實現YOLOV3,與SSD 以及RCNN代碼有很多類似的地方,大家可以參考往期的文章進行對比學習,把代碼執行一遍
進行視頻識別的思路:從視頻中提取圖片,進行圖片識別,識別完成後,再把識別的結果實時體現在視頻中,這部分代碼結合前期的視頻識別,大家可以參考多進程視頻實時識別篇,因為沒有多進程,檢測速度很慢,視頻看着比較卡
1、初始化模型以及視頻流
2、從視頻中提取圖片,進行圖片的blob值計算,進行神經網絡的預測
3、提取檢測到圖片的置信度以及ID值
4、 應用非最大值抑制來抑制弱的重疊邊界,顯示圖片
5、關閉資源,顯示圖片處理信息
每個目標檢測算法都有自己的優缺點,個人感覺,在精度要求不是太高的情況下SSD檢測算法可以實現較快的速度實現,畢竟精度差不多的情況下,我們希望速度越快越好
原創文章,作者:AAT9G,如若轉載,請註明出處:https://www.506064.com/zh-hk/n/128685.html