步態識別:50米外 秒讀你的“活體密碼”


在央視大型科技挑戰節目《機智過人》中,由中科院自動化所研發出的步態識別系統,先後對10個身高、體型相似的蒙面人“嫌疑犯”與21隻體型、毛色相似的金毛犬進行識別,在與“最強人類”袁夢(國際記憶大師,曾成功從168條音軌中辨識出TFBOYS三位的音軌)的挑戰中,均取得了成功。

憑藉“遠距離步態識別系統研究與應用”項目,中國科學院自動化研究所及其所孵化的人工智慧企業銀河水滴科技(北京)有限公司,獲得2018年度北京市科學技術獎二等獎。

又快又準,不看臉也能快速辨認

步態識別是一種非接觸的生物特徵識別技術。顧名思義,就是通過人們走路的姿態進行身份識別。“設想這樣一個情景:某人頭戴帽子口罩,臉部被遮擋,並離攝像頭很遠,這時已經無法根據臉部資訊識別其身份,然而仍然可以分析他的步態資訊,通過步態識別系統識別他的身份。”項目負責人、中科院自動化所研究員王亮舉例説,與其他生物識別技術相比,步態識別具有遠距離、非接觸、不易偽裝等優點。

首先是步態識別適用距離更遠。通常情況下,為達到良好識別效果,虹膜識別需要目標在60釐米以內;人臉識別需要目標在3米以內;而步態識別的目標可以遠達50米。其次是步態識別為非受控識別,無需識別對象主動配合與參與。指紋識別、虹膜識別、人臉識別等都需要識別對象主動配合。步態是遠距離、非受控場景下唯一可清晰成像的生物特徵,即便一個人在幾十米外背對普通攝像頭隨意走動,步態識別演算法也可對其進行身份判斷。再者,步態難以偽裝。不同的體型、肌肉骨骼特點、運動神經靈敏度、走路姿態等特徵共同決定了步態具有較好的區分能力,通過精巧設計的演算法和海量數據的訓練,機器可以更好地識別這些細節特徵。

黑科技滿滿的《碟中諜5》中,最吸睛的當屬安保系統的最後一道防線——步態識別,通過分析人的身體體型和行走姿態來識別身份,這道防線讓阿湯哥也難以瞞天過海。“每個人的肌肉力量、肌腱和骨骼長度和密度,以及每個人的神經靈敏程度、協調能力、體重、重心等生理條件都是不同的,所以,每個人走路的姿勢都是不同的。人們可以借助道具將自己的外形甚至是性別進行翻天覆地的改變,卻沒辦法改變自己的走路姿態。”王亮表示。

而相較于依靠人力從海量監控視頻中快速搜尋目標人物的做法,步態識別不僅能實現對人海戰術的替代,極大提升檢索和識別的效率和準確度,而且當出現遠距離、非配合、全視角(如只有側面和背面身形)、弱光線、人臉隱蔽/遮擋、目標人物多次換裝等一種或多種情況時,用步態識別技術也能成功搜檢目標人物。

精確的圖像分割和數據演算法支撐

然而,要精確地通過步態特徵識別出人的身份資訊,需要複雜的系統支撐。步態識別系統包含了檢測、跟蹤、分割、識別等部分,任何一個模組都將對整體系統産生影響。

“遠距離步態識別系統研究與應用”項目在演算法層面對步態識別系統的4個關鍵模組分別進行研發,通過行人檢測演算法,將行人從背景中找出來,檢測演算法需要能夠處理遠距離、複雜背景以及部分遮擋等情況;與人臉識別只對一張圖片識別不同,步態識別需要收集同一個人行走的視頻序列,且實際場景中通常有多個人需要同時識別,因此需要使用線上多目標跟蹤技術將同一個人的序列收集起來;步態能夠去除著裝顏色的干擾,只關注人走路的方式,因此需要使用人形分割演算法將人從背景中分離出來;最後,對一系列分割序列通過步態識別演算法進行識別。

在中科院自動化所的模式識別國家重點實驗室,記者看到了項目的“高精度人形圖像分割方法”演示。無論是複雜的背景、多樣的姿態、不同的尺度變化以及不同的衣著,系統都能夠非常快速準確地分割出人像。

“我們採用的是人形區域內像素點的多尺度上下文資訊來表達人形目標,通過多通道深度學習網路來描述人形局部區域的不同尺度上下文資訊。”王亮講道,這種方法以模式識別和電腦視覺理論為指導,結合最新的深度學習演算法,融合各個尺度的圖像資訊,能夠將目標人物從背景中快速準確地分離出來。與傳統的圖模型方法需要對像素點之間建模,導致計算量大、難以收斂等問題相比,該方法具有很強的語義資訊,並在由百度公司懸賞的人形圖像分割大賽中,以絕對優勢獲得冠軍。

此外,他們借助傳統的步態識別的先驗知識,結合最新的深度學習方法,能夠在只給定某個視角的情況下,跨視角地識別出該人在其他視角的步態序列。“使用基於“正負對”的訓練方式,可以充分地擴充樣本數量,即使對很少的訓練數據也能達到很高的結果。這種方式在人臉識別、行人再識別領域也有廣泛應用。”在此基礎上,項目組還提出了一種基於拓撲表達的跨視角步態識別方法來描述步態的整體時空結構,在跨視角和遮擋的條件下,比傳統方法表現出了更強的魯棒性和更高的識別精度;對跨著裝以及跨背包的場景,也都能獲得更好的結果。

除了演算法以外,充足的數據支援是步態識別系統“聰明與否”的後盾保障。目前基於深度學習的步態識別相關演算法都需要大量的數據,因此演算法和數據之間的不斷迭代是十分必要的。王亮告訴記者,中科院自動化所的CASIA步態數據庫有三個數據數據集,即Dataset A(小規模庫), Dataset B(多視角庫)和Dataset C(紅外庫)。其中,Dataset B是一個大規模、多視角的步態庫,世界知名,而銀河水滴的步態數據庫則已經超過Dataset B近100倍,命名為“CASIA—E”。

産學研緊密結合,不斷拓展新應用場景

得益於中科院自動化所在電腦視覺領域20多年的技術積累,銀河水滴在中科院“技術+團隊”的離崗創業政策激勵下成立。銀河水滴聯合中科院自動化所目前已經啟動人工智慧人才聯合培養計劃,聯合打造中國頂級人工智慧實習基地。該人才計劃將配備強大的導師隊伍,每位實習生配備至少一名中科院自動化所老師和銀河水滴高級工程師做指導,銀河水滴的技術應用場景將全部開放,供實習生研究和實地演練。

“在産、學、研緊密結合下,參與該人才計劃的實習生,其人工智慧演算法和産品能力將得到巨大提升。”作為中國首個步態識別博士、模式識別國家重點實驗室副主任,以及銀河水滴聯合創始人,王亮對於步態識別的産業化充滿了信心。他表示,不要僅僅發表論文,通過銀河水滴,把科研成果變成産品形成産業,提供世界領先的視覺大數據分析技術,是對年輕人很大的激勵。

基於項目的一系列人工智慧關鍵技術研發,銀河水滴目前已經在公共安全以及智慧家居領域取得了很好的進展。王亮介紹,項目所開發的步態檢索系統,在維護公共安全方面發揮了重要作用;銀河水滴在實現步態識別基本技術的基礎上,還將全類型人臉識別以及人群計算應用於泛身份識別構建之中,以達到更精確的識別結果。“目前人臉識別方案在主流數據庫上達到99%的識別率並可保持實時性;在遠距離人臉識別方面,可對普通2K錄影機中25米外的人群進行實時人臉識別。”

在商業化應用方面,銀河水滴科技已經基於産品雛形,面向安防、油田和家電等領域進行推廣,尋找更多適合步態識別應用的客戶,推動了傳統行業的智慧化升級:石油企業引入步態識別技術完善防控網路,防範非法闖入者對油田安全的威脅和對油田經濟利益的損害;在智慧家居領域,步態識別可很好地區分用戶屬性,開發的嵌入式模組,具有很大的成本優勢及體積優勢,不僅能替代遙控器等傳統操作工具,還可以讓家電感知更加智慧化、服務更加個性化。“譬如,根據家庭成員的步態特徵,空調可以及時識別老人、小孩等特殊人群的活動範圍,能夠根據不同人群調整空調的出風角度、出風量及溫度,讓溫度控制更適合人群需求。”王亮説。

與此同時,步態識別也面臨著很多挑戰亟須解決:比如在人群密集場所,如何解決遮擋情況下的身份識別?智慧深度傳感硬體Kinect等又會對步態識別産生什麼影響?王亮表示,這一系列的問題仍然需要我們在未來去深入探索。接下來,銀河水滴科技還將選擇一兩個屬於藍海市場的細分領域深挖下去,與中科院自動化所緊密配合,做好科技成果的産業化。