昆蟲圖像自動鑒定是一種快速鑒定昆蟲的方法,圖像分割則是其中的關鍵步驟。隨著計算機圖像技術的發展,昆蟲圖像分割方法吸收了許多圖像分割領域中新興的方法,諸如閾值分割法、區域提取技術、邊緣檢測方法和結合特定理論工具的分割方法等。閾值分割法計算簡單、速度快,通常利用圖像的灰度直方圖求取閾值,主要適用于灰度圖像。區域提取技術在昆蟲圖像中的應用相對較少,該類方法通常和閾值法或分類技術相結合,對待分割圖像首先進行灰度轉換,劃分前景和背景,再利用區域增長算法實現分割,適用范圍有限。邊緣檢測方法在昆蟲圖像分割中應用較多,是當期的研究熱點,該類方法適合于彩色昆蟲圖像,但有時存在過分割現象。結合特定理論的方法主要包括模糊聚類FCM算法、基于Gabor濾波器和支持向量機SVM的算法、多特征最大期望值EM算法等等,這些算法通常利用圖像的紋理、色彩等多種信息,分割時使用較復雜的判定方法,更接近于通用的圖像分割方法研究。
雖然大量的圖像分割方法被引入到昆蟲圖像研究中,但由于昆蟲圖像采集條件和昆蟲圖像本身都具有復雜性,目前分割技術依然是阻礙昆蟲圖像廣泛應用的關鍵。多元線性回歸\\(linearregression\\)是利用數理統計中的回歸分析來確定兩種或兩種以上變量間相互依賴的定量關系的一種統計分析方法,它在生物、醫學、工業、農業、經濟以及物理和自然等領域運用十分廣泛。采用多元線性回歸算法實現昆蟲圖像分割能夠較好地將目標與背景分割開來,但該算法對具有陰影背景的部分昆蟲圖像的邊界分割效果不太理想。
圖像過渡區是指介于圖像背景和目標之間的一個特殊的區域。它既有邊界的特點,將不同的區域\\(前景和背景\\)分開;也有區域的特點,其自身有寬度,且面積不為零。利用圖像過渡區實現圖像的前景和背景分離是圖像分割的新途徑。本文利用過渡區對多元線性回歸昆蟲圖像分割算法進行優化。算法首先確定昆蟲圖像RGB三色板的多元線性回歸模型,并對回歸模型進行范數優化,然后利用優化后的回歸模型對昆蟲圖像進行分割。對于邊界分割效果不理想的圖像,將分割后的彩色圖像轉換為灰度圖像,求取灰度圖像的過渡區,再運用過渡區分割算法對其進行二次分割優化。優化算法有效結合了多元線性回歸算法和過渡區分割算法的優勢,增強了多元線性回歸算法的魯棒性,提高了昆蟲圖像的分割精度。
1、多元線性回歸分割算法
1.1多元線性回歸的數學模型
線性回歸根據自變量的個數不同分為一元線性回歸和多元線性回歸。線性回歸算法最初應用于圖像處理中時通常選用灰度圖像或彩色圖像三色板中的一個色板的像素信息通過構建一元回歸模型來實現,然而一元線性回歸具有較大的局限性,三色板像素信息更有利于表達圖像的完整信息,因此需要借助多元線性回歸模型。
多元線性回歸研究一個因變量和多個自變量之間數量上相互依存的線性關系。多元線性回歸模型的方程是:Y=β0+β1X1+β2X2+…+βmXm+ε\\(1\\)其中,β0是常數項,β1,β2,…,βm稱為偏回歸系數\\(partialre-gressioncoefficient\\)。βi\\(i=1,2,…,m\\)的含義是在其他自變量保持不變的條件下,自變量Xi改變一個單位時因變量的平均改變量。ε為隨機誤差,又稱殘差\\(residual\\),它表示Y的變化中不能由自變量解釋的部分。
1.2基于RGB三色板的多元線性
回歸算法在圖像處理過程中,為了充分利用彩色圖像RGB各個分量像素的數據,考慮利用圖像的RGB三色板的像素來處理圖像。根據式\\(1\\)的多元線性回歸數學模型,結合彩色圖像中的三色板信息,建立彩色圖像的RGB三色板多元線性回歸模型如下:
R=β0+β1*G+β2*B\\(2\\)其中,R、G、B分別表示彩色圖像的紅色板、綠色板和藍色板像素信息。
圖像的像素信息通常采用二維坐標表示,即假設I\\(i,j\\)表示圖像I的第\\(i,j\\)個像素,R\\(i,j\\)、G\\(i,j\\)、B\\(i,j\\)分別代表像素I\\(i,j\\)的紅、綠、藍3個分量。將這些像素信息代入式\\(2\\)中,RGB三色板的多元線性回歸模型轉換為:R\\(i,j\\)=β0+β1G\\(i,j\\)+β2B\\(i,j\\)\\(3\\)為了計算方便,圖像處理中通常將二維向量轉換成一維向量,即使用變換:R\\(i,j\\)→R\\(m\\(j-1\\)+i\\),i=1,…,m,j=1,…,n則式\\(3\\)再次轉換為如下形式:R\\(j\\)=β0+β1G\\(j\\)+β2B\\(j\\)\\(4\\)其中,R\\(j\\)、G\\(j\\)、B\\(j\\)分別代表紅色板、綠色板和藍色板像素的一維信息,與式\\(1\\)多元線性回歸模型中的X、Y變量相對應,則式\\(4\\)的變量形式為:
Y=[R\\(1\\)R\\(2\\)…R\\(m×n\\)]
T系數矩陣為:β=[β0β1β2]T
根據矩陣理論相關知識可得線性回歸參數的求解公式為:β=\\(XTX\\)-1XTY\\(5\\)由于圖像的三色板信息已知,因此可根據所選取區域的R、G、B信息確定β參數,建立整幅圖像的線性回歸模型,從而將具有同樣背景信息的圖像分割出來,得到昆蟲的目標圖像。實際應用中,樣本像素塊的選取依據具體圖像的背景信息而定\\(見圖1\\(b\\)\\),背景顏色越單純,所需像素塊數越少,反之則需要設置多個像素塊,以包含更全面的圖像信息。樣本信息越多越有利于圖像目標區域的分割,但同時也加大了工作量,對復雜背景圖像選擇合適數量的像素塊不是容易的事,對此引入范數對式\\(3\\)的模型進行優化。
1.3RGB三色板線性回歸模型的范數優化
式\\(3\\)的回歸模型是取圖像像素的RGB三色板信息建立線性關系,由于像素信息的取值范圍較大,有可能導致回歸模型的線性擬合發生較大偏差,對三色板信息進行取范數規范化處理可以較好地解決這個問題。R\\(i,j\\)、G\\(i,j\\)、B\\(i,j\\)的規范化形式如下:
則式\\(4\\)的多元回歸模型轉換為:
以稻棘緣蝽成蟲圖像為例,比較對三色板信息進行取范數規范化前后的分割效果,說明利用式\\(9\\)對昆蟲圖像進行分割能夠更好地實現目標提取。從經過預處理的稻棘緣蝽成蟲圖像的背景樣本中采集合適數量的像素塊,分別利用式\\(4\\)和式\\(9\\)實現對整個圖像的分割,如圖1所示。其中圖1\\(a\\)為原圖,圖1\\(b\\)為從背景中任意選取的一塊像素塊樣本,圖1\\(c\\)為基于式\\(4\\)的回歸算法分割效果,圖1\\(d\\)為基于式\\(9\\)的范數優化后的分割效果。
對比圖1\\(c\\)和圖1\\(d\\)可知,進行范數優化后的算法在去掉陰影方面具有一定的優越性,能更好地實現目標提取。然而該算法依然存在不足,即在稻棘緣蝽成蟲圖像的邊界處仍然有部分陰影未被去掉,即對稻棘緣蝽成蟲圖像的邊界分割效果不理想。過渡區結合了邊界與區域的特點,利用過渡區算法在分割含陰影圖像或背景邊界不清晰圖像上有更好的效果,因此,結合過渡區算法進行優化能更好地實現含陰影的昆蟲圖像分割。
2、結合過渡區的多元線性回歸算法
圖像過渡區是介于背景和目標之間的區域,是一個特殊的區域。它既有邊界的特點,可以將不同的區域分開;也有區域的特點,其自身有寬度,且面積不為零。過渡區在空間上位于目標和背景之間,其中的像素的灰度也在對應的目標和背景之間。圖像過渡區的存在將會為圖像分割提供一種新的可靠的方法。
2.1圖像過渡區確定
過渡區的確定取決于圖像的有效平均梯度\\(EAG\\)和對圖像灰度的剪切\\(CLIP\\)。設f\\(i,j\\)為二維空間變化的圖像函數,\\(i,j\\)表示像素空間坐標,f表示像素點的灰度值;g\\(i,j\\)代表f\\(i,j\\)的梯度,可通過梯度算子作用于f\\(i,j\\)得到,即g\\(i,j\\)=▽f\\(i,j\\)。有效平均梯度EAG的定義為:EAG=TG/TP\\(10\\)其中,TG=∑i,j∈Sg\\(i,j\\)為梯度圖的總梯度值;TP=∑i,j∈Sp\\(i,j\\)為非零梯度像素的總數,其中,p\\(i,j\\)=1,ifg\\(i,j\\)>00,ifg\\(i,j\\){=0。
由此可知,有效平均梯度EAG只與非零梯度像素有關。影響過渡區確定的另一個因素是對圖像灰度的剪切,過渡區算法的剪切可分為高端剪切fL\\(i,j\\)和低端剪切fL\\(i,j\\)兩種。設L為剪切值,即被剪切的部分,其范圍為0~255,則剪切后的圖像可分別表示為;
剪切值從零灰度值開始剪切,對剪切后的灰度圖像求梯度,其梯度函數必然與剪切值L有關,由此得到的EAG也變成了L的函數EAG\\(L\\)。EAG\\(L\\)與剪切的方式也有關,對應高端和低端剪切的EAG\\(L\\)可分別寫成EAGhigh\\(L\\)和EAGlow\\(L\\)。典型的EAGhigh\\(L\\)和EAGlow\\(L\\)曲線都是單峰單線,即它們各有一個極值,如圖2所示。設EAGhigh\\(L\\)和EAGlow\\(L\\)曲線的極值點分別為Lhigh和Llow,則它們可表示為:
Lhigh=Arg{MaxL∈F[EAGhigh\\(L\\)]}\\(13\\)Llow=Arg{MaxL∈F[EAGlow\\(L\\)]}\\(14\\)
兩個極值點對應灰度值集合中的兩個特殊值,它們在灰度值上限定了過渡區的范圍。根據式\\(13\\)和式\\(14\\)可計算出Lhigh和Llow,從而確定出過渡區,即:TR={\\(i,j\\)∈I|Llow≤f\\(i,j\\)≤Lhigh}\\(15\\)2.2過渡區算法優化圖像分割效果由于多元線性回歸算法對含有陰影的昆蟲圖像邊界分割不準確\\(見圖1\\(d\\)\\),因此本文引入過渡區分割算法,將多元線性回歸算法與過渡區相結合,實現對昆蟲圖像的分割。
過渡區分割算法主要面向灰度圖像,因而要求取圖像過渡區需首先將多元線性回歸算法分割后的彩色圖像轉換為灰度圖像。將轉換后的灰度圖像作為原始圖像,再利用3.1節中介紹的方法求取它的過渡區。繼續以圖1的稻棘緣蝽成蟲為例,圖3\\(a\\)為圖1\\(d\\)中利用多元線性回歸規范化算法分割的圖像,求取其對應的灰度圖,如圖3\\(b\\)所示,圖3\\(c\\)為利用式\\(15\\)得到的過渡區截取圖像。
一旦確定了過渡區,進一步對昆蟲圖像分割就比較容易了。因為真正的邊界是在過渡區之中,所以可以借用過渡區里像素的信息來幫助分割。本文采用這些像素確定一個閾值來實現分割。由于Lhigh和Llow限定了邊界線灰度值的上下界,閾值可直接借助它們來計算,即根據Lhigh和Llow確定一個閾值來實現對昆蟲圖像的進一步分割。由于過渡區的確定都保證了邊界線灰度值的范圍,因此分割偏差太大的可能性很小,也可以說這種方法的抗干擾能力較強。
3、算法設計實現
基于過渡區優化的多元線性回歸分割算法結合了多元線性回歸和過渡區算法的優點。算法首先對預處理的昆蟲圖像建立多元線性回歸模型,并對回歸模型進行范數優化,然后利用優化后的回歸模型對昆蟲圖像進行分割,對于邊界分割效果不理想的圖像,將其轉化為灰度圖像,求取過渡區,再運用過渡區分割算法對其邊界進行二次分割優化。算法的主要步驟和實現流程如下。
3.1算法實現步驟
結合過渡區的多元線性回歸昆蟲圖像分割算法的具體步驟如下:
Step1圖像預處理:首先將昆蟲圖片進行統一的亮度處理,使圖片不至于過亮或者過暗。
Step2背景樣本塊選擇:從圖像的背景信息中選擇有代表性的區域作為樣本塊,以求取回歸參數。由于不同圖像的背景信息不同,單純一色的背景也可能由于色度深淺不均帶來誤差,因而提取1塊像素塊作為回歸模型樣本具有較大的局限性。實驗證明,在昆蟲圖像分割中,選擇4~7塊樣本塊效果較好。
Step3建立回歸模型:根據樣本塊信息按照式\\(5\\)計算回歸參數,建立式\\(4\\)的圖像RGB多元線性回歸模型。
Step4求取RGB像素范數:根據式\\(6\\)-式\\(8\\),計算三色板像素的范數,構建優化模型,見式\\(9\\)。
Step5昆蟲圖像提取:利用優化模型,實現昆蟲圖像。
分割。
Step6確定過渡區:將采用多元線性回歸算法分割后的彩色圖像轉化為灰度圖像,并確定其過渡區。
Step7基于過渡區的優化分割:取過渡區兩邊界的灰度值Lhigh和Llow之間的均值作為閾值,以此閾值分割原始圖像,得到優化后的分割圖像。
3.2算法流程圖
根據上述討論,采用多元線性回歸與過渡區相結合的算法對昆蟲圖像進行分割的流程如圖4所示。
4、實驗驗證與效果分析
為了驗證本文算法的有效性,以3張經過預處理的昆蟲圖像分割為例進行對比研究,3張圖片的尺寸分別為551×364、630×472、552×374,且它們的水平分辨率和垂直分辨率均為96dpi。圖片來源于課題組的科研數據庫。算法在Win-dowsXP系統下,利用Matlab實現。
分別將本文提出的優化算法和原有多元線性回歸算法及文獻的基于區域的分割算法進行對比,將3種算法分別應用于所選圖片進行分割。為了增強顯示結果的可視性,對本文算法和文獻提出的算法的分割結果進行了偽彩色處理,效果如圖5所示。圖5\\(a\\)為3種昆蟲的原圖像;圖5\\(b\\)為利用文獻[5]的區域分割算法分割后的圖像,3種昆蟲圖像中,紅蜘蛛圖像和飛蛾圖像因為陰影區域較少,分割效果好于青步甲成蟲圖像,但昆蟲邊界分割不夠精確,青步甲成蟲圖像則包含較多陰影背景;圖5\\(c\\)為多元線性回歸算法分割后的圖像,整體分割效果優于圖5\\(b\\)的區域分割算法,圖像邊界分割較清晰,但圖像陰影部分沒有完全去除;圖5\\(d\\)為由圖5\\(c\\)生成的對應灰度圖;結合過渡區算法得到圖5\\(e\\)所示的本文算法的分割結果。由圖5\\(e\\)可以看出,本文提出的過渡區優化算法彌補了多元線性回歸算法的不足,對含陰影昆蟲圖像的分割效果良好。
為了進一步客觀評價實驗結果,本文采用FOM\\(FigureofMerit\\)定量地分析各檢測算法的性能。
FOM的定義如下:
其中,Ni和Nt分別為實際和檢測到的邊緣像素的數量;α為補償系數\\(通常取值為1/9\\);di為檢測到的邊緣點與其最近的理想邊緣點的距離。FOM值處于0到1之間,其值越大,說明邊緣檢測效果越好。分別計算圖5中3種算法的FOM值,結果如表1所列。
從表1中可以看出,對于以上3張圖像,本文方法的FOM值均較大,說明檢測結果相對較好,即改進算法比其它算法能更好地實現對含陰影昆蟲圖像邊界的分割。運行時間方面,改進算法由于是在多元線性回歸算法的基礎上再進行優化分割,因此速度上比單獨應用多元線性回歸算法稍慢。區域分割算法由于通常結合其他方法先進行閾值判斷或分類,再利用區域增長算法進行分割,因此運行速度不占優勢,比多元線性回歸算法耗時更長,與本文算法的運算時間相當。
3種算法分割上述昆蟲圖像的運行時間\\(單位:秒\\)對比如表2所列。
綜合分析表1和表2,本文提出的結合過渡區優化的多元線性回歸圖像分割算法相比原多元線性回歸算法和區域分割法在分割帶有陰影背景的昆蟲圖像方面具有更好的特性,在速度和效果上達到了一個較好的平衡,能較好地解決含陰影昆蟲圖像邊界分割效果不理想的問題,更準確地實現昆蟲圖像分割。
結束語
本文介紹了一種結合過渡區優化的多元線性回歸圖像分割方法,說明了其在昆蟲圖像分割中的應用。實驗和分割效果對比證明,本文提出的算法能較好地解決含陰影的昆蟲圖像邊界分割效果不理想的問題,更加精確地實現昆蟲圖像分割。在實際的農林蟲害防治中,運用本文算法能夠很好地識別害蟲,將其中的目標區域\\(害蟲\\)分離出來,從而實現僅對害蟲進行藥劑噴灑,防止了由于化學藥劑的大面積使用而造成的環境污染問題。本文算法的不足是目前更適合于背景顏色較少、背景色彩分布較均勻、背景和前景顏色相差較大的昆蟲圖片。下一步將針對各種復雜背景圖片及背景與前景顏色比較接近的圖片進一步優化和完善算法,以擴大算法的應用范圍。
參考文獻:
[1]王江寧,紀力強.昆蟲圖像分割方法及其應用[J].昆蟲學報,2011,54\\(2\\):211-217.
[2]于新文,沈佐銳.昆蟲數字圖像的分割技術研究[J].農業工程學報,2001,17\\(3\\):137-141.
[3]羅濤華.基于自適應閾值的儲糧害蟲圖像分割算法[J].武漢工業學院學報,2006,25\\(1\\):5-8.