基本原理
視頻運動目標(biāo)的檢測與跟蹤是機器視覺中研究熱點之一,是目標(biāo)識別、行為分析等后續(xù)應(yīng)用的基礎(chǔ),在社會安全、航空航天等領(lǐng)域中有廣泛的應(yīng)用前景。目標(biāo)跟蹤在學(xué)術(shù)界經(jīng)過了數(shù)十年的研究,發(fā)展出了許多算法,目前較為有效的算法是基于檢測的跟蹤算法。其基本思想是,在跟蹤開始時對目標(biāo)建立一個初始模板,以記錄目標(biāo)的外觀;為了確定目標(biāo)在下一個時刻的位置,利用當(dāng)前的目標(biāo)模板,在前一時刻目標(biāo)位置附近處搜索與目標(biāo)模板相似的區(qū)域,選擇相似度最大的區(qū)域作為這一時刻目標(biāo)的真實位置;跟蹤過程中,由于目標(biāo)的外觀受到各種因素的影響(目標(biāo)變形、姿態(tài)變化、光照、遮擋等)而發(fā)生變化,目標(biāo)模板也進行相應(yīng)的更新,使其能體現(xiàn)出目標(biāo)當(dāng)前的變化。
基于這種跟蹤框架的算法都面臨著以下幾個重要的問題。目標(biāo)模板要有較強的表達能力,即目標(biāo)外觀特征表示要強健;該特征應(yīng)具有較高的判別能力以區(qū)分目標(biāo)與背景的差別;同時該特征對于各種影響目標(biāo)外觀的因素有較好的魯棒性,以解決目標(biāo)在跟蹤過程中的外觀變化問題,保證跟蹤的穩(wěn)定性。目標(biāo)模板與候選區(qū)域的相似度計算要具有較高的準(zhǔn)確性,在目標(biāo)與背景較為相似的情況下,要能夠體現(xiàn)出真實目標(biāo)與背景的差別,不能把相似的背景判定為目標(biāo)。目標(biāo)模板要能自適應(yīng)地更新,當(dāng)目標(biāo)的外觀發(fā)生變化,模板也要進行更新,這種更新是自我學(xué)習(xí)的過程,要保留目標(biāo)穩(wěn)定、不變形的特征,去除姿態(tài)、光照、遮擋等帶來的干擾因素。針對這些問題,我們提出了基于受限自適應(yīng)層次化稀疏表示的多目標(biāo)跟蹤算法,該算法的框架圖如下:
圖 1:算法框架圖
該算法利用稀疏表示的能力,結(jié)合分層表達思想,將層次化和稀疏表示(特征)相結(jié)合,有效提高了目標(biāo)的模板的表達能力。在建立模板時,不僅對目標(biāo)建立模板,對背景也建立建模,在判斷候選區(qū)域是否為目標(biāo)時,可以結(jié)合兩個相似度進行判定,分類結(jié)果更準(zhǔn)確。在跟蹤過程中,不斷更新模板時,對目標(biāo)和背景建立模板池,收集一段時間內(nèi)的目標(biāo)和背景特征分布,使得模板池的魯棒性更強。為了保證算法的實時性,有選擇性地對模板進行更新,對當(dāng)前的新目標(biāo)進行判斷,如果和模板池差別很小,則不更新模板;差別非常大說明跟蹤失敗,也不更新;只有在合適的時機才更新模板,即保持模板的穩(wěn)定性,又能減少運算,達到實時性。為了更準(zhǔn)確地度量目標(biāo)和背景之間差異,采用自適應(yīng)權(quán)重調(diào)整方法,將目標(biāo)模板和背景之間不相似的特征賦予較大的權(quán)值,相似的特征賦予較小的權(quán)值,增強目標(biāo)與背景之間的區(qū)分度。通過建立目標(biāo)的時序特征模型,保證目標(biāo)模板的時序連貫性與完整性。
算法的主要流程:算法對視頻中多目標(biāo)的狀態(tài)采樣后,結(jié)合時間約束、空間約束對多層稀疏表示特征進行加權(quán),并通過目標(biāo)基、背景基的更新機制,在標(biāo)準(zhǔn)對沖跟蹤框架判斷后得到目標(biāo)的狀態(tài)(包括大小、方向、位置等);在目標(biāo)丟失后,結(jié)合稀疏分類器網(wǎng)格粗略檢出目標(biāo)后再次判斷,從而實現(xiàn)復(fù)雜場景下實時的目標(biāo)跟蹤。