關(guān)鍵詞:組群行為識別 局部聚合描述符 雙流網(wǎng)絡(luò) 分層長短時(shí)記憶
摘要:構(gòu)建端到端的深度學(xué)習(xí)網(wǎng)絡(luò)結(jié)合局部聚合描述符(Action vector of locally aggregateddescriptor,ActionVLAD)池化層和多層長短時(shí)記憶(Long short time memory,LSTM)解決組群行為識別問題。在傳統(tǒng)的單一圖像信息(Red Green Blue,RGB)作為深度學(xué)習(xí)網(wǎng)絡(luò)的輸入基礎(chǔ)上,添加密集光流信息(Dense_flow),描述視頻幀間的運(yùn)動(dòng),作為雙流網(wǎng)絡(luò)的輸入;通過底層LSTM對特征信息進(jìn)行建模,由融合的雙流特征來表示個(gè)人行為;而ActionVLAD池化層可以對不同時(shí)間、圖片不同位置的特征進(jìn)行融合,從而更好地融合個(gè)人信息;最后頂層LSTM連接Softmax分類器,通過融合的個(gè)人信息判斷組群活動(dòng)。在Collective activity dataset數(shù)據(jù)集上的測試實(shí)驗(yàn)獲得了82.3%的平均識別精度。
數(shù)據(jù)采集與處理雜志要求:
{1}基金項(xiàng)目:如果論文是項(xiàng)目成果,請按“項(xiàng)目名稱(項(xiàng)目號)”的形式寫出。項(xiàng)目名稱與項(xiàng)目號兩者都要有。
{2}稿件應(yīng)具有科學(xué)性、創(chuàng)新性和實(shí)用性,論點(diǎn)明確、論據(jù)可靠、數(shù)據(jù)準(zhǔn)確、邏輯嚴(yán)謹(jǐn)、文字通順。
{3}文中圖表或插圖請附清晰的原圖文件(tif. 或eps.格式,不低于600 像素)。
{4}注釋是對論文中某一特定內(nèi)容的解釋或補(bǔ)充說明,用帶圈數(shù)字注于當(dāng)頁頁腳。
{5}稿件文字、標(biāo)點(diǎn)、年代、數(shù)字等書寫方式均以國家有關(guān)規(guī)定為準(zhǔn)。
注:因版權(quán)方要求,不能公開全文,如需全文,請咨詢雜志社