人臉識別:源自破案需求 99.5%識別率仍存隱患
- 發佈時間:2015-06-02 08:04:00 來源:中國新聞網 責任編輯:書海
這組報道關注的是最近熱門的人臉識別技術。從某種意義上看,它並不是什麼新技術。但是過去識別的準確率不高,只是在小範圍應用。在電腦深度學習技術近年取得突破後,識別的準確率和穩定性大大提高。
恰恰在此時,國內的網際網路金融産業如火如荼。網際網路金融的進一步發展要突破傳統金融服務的地域限制,而運用人臉識別技術,銀行甚至連營業場所也不需要了。這種衝擊和變革是巨大的,一些券商、銀行正在摩拳擦掌,蠢蠢欲動,以圖佔領競爭先機,但目前離全面應用尚面臨諸多障礙。
站在更廣泛意義上來説,以人臉識別為代表的生物識別技術,其實是對過去密碼時代的顛覆。輸入繁瑣的密碼是過去進行身份驗證的必備程式,但人臉識別可能消滅密碼。網際網路新的安全驗證手法正在形成新的産業浪潮。本專題試圖深度解讀這些技術變革所帶來應用産業變化的脈絡,並了解目前應用層面所面臨的法律政策難題。
本報記者 吳燕雨 王臣 北京報道
從事了26年人臉識別技術研究的清華大學電子工程系教授蘇光大看來,人臉識別應用已經進入了爆髮式增長的階段。
這並不誇張。如果你留意了下面的場景,你會發現人臉識別已經不再是《碟中諜》中才有的特定場景,它正在進入普通人的日常生活。
最近,測試顏值、年齡的app似乎在一夜之間霸佔了朋友圈;去年,阿里巴巴推出了刷臉支付功能,今年4月,馬雲就在德國漢諾威IT博覽會上現場演示了刷臉支付。在可預期的未來,網站登錄、上班打卡、遠端開戶都可以通過刷臉來實現。人臉似乎正在成為新時代的網路通行證。
“人臉是可以取代賬號密碼的。”為ios、安卓提供刷臉登陸的一登團隊創始人沈洽金對21世紀經濟報道記者説。
而新密碼體系的出現似乎也正在成為一個越來越急迫的需求。12306用戶資訊被盜、社保卡資訊洩露……幾乎每天都在發生的資訊洩露事件已經不再是新鮮話題。
如何構建一種不易被盜取的密碼體系?生物識別技術提供了一種可能。這種識別技術近一兩年在準確率和穩定性上已取得較大突破,等待它的將是市場應用的爆發。
源於破案需求
“中國的人臉識別應用走在世界前列,國內最早的研究始於破案的需求。”國內最早研究人臉識別技術之一的蘇光大對21世紀經濟報道記者表示。
當時辦案需要根據模擬畫像來鎖定嫌疑人範圍,而這種手法對畫家的技能要求很高,大部分警察都不具備這樣的能力。於是有人開始思考用電腦來解決這個問題。
1989年,蘇光大承接了公安部的“GA電腦人像組合系統”項目。當時,憑目擊者的記憶描述犯罪嫌疑人的相貌特徵,在資訊庫取來與之相應的眼睛、鼻子、嘴巴……直到組合成一個與犯罪嫌疑人特徵相像的人像,供警方參考。
然而這種基於幾何特徵的人臉識別技術並不成熟,識別率不高,且在應用上也僅限于極少數地區的公安系統。
1991年,麻省理工學院媒體實驗室的Turk和Pentland提出了對於人臉識別具有里程碑意義的“Eigenfaces”特徵臉方法,之後出現了很多基於這種方法的研究。
EigenFace的思想是把人臉從像素空間變換到另一個空間,在另一個空間中做相似性的計算。它選擇的空間變換方法是PCA,即主成分分析法。其大意是將一個複雜的多參數問題通過逐級分級轉化為僅有少數參數的問題的綜合方法。
“PCA把人臉識別帶入到了正確的軌道中。”蘇光大表示。結合PCA技術,蘇光大將其升級,在整張臉識別的基礎上,再將人臉分為各個部件,分別將這些部件的特徵抽象成電腦語言。
中國有很好的人臉資源,即把二代身份證圖像庫作為識別標準。而基於監控技術的逐漸發展,像素的提高,也給人臉識別技術提供了繼續發展的基礎。
2008年北京奧運會刷臉進場——進入鳥巢前,除門票外,還要逐一在進場通道前拍照。攝像頭會在兩秒內抓拍人臉,定位面部關鍵點,並提取特徵,隨後將認證結果同時上傳到電腦,電腦與觀眾的身份資訊進行比對。“這是第一次國家層面應用人臉識別技術。”蘇光大説。
他介紹,國內第一次大規模應用是在2011年戶籍查重。他回憶稱,發現這一用途是由於自己在湛江協助調查案件時的一次偶然發現,當時警察拿著兩個不同身份的人諮詢,通過系統識別,兩張照片顯示為同一個人,之後湛江市展開了庫內身份查重,發現上萬個重復戶籍,其中8名逃犯。
基於同樣的做法,公安部號召在全國進行身份查重工作。當時公安部要求各省市公安廳全部引用人臉識別系統進行查重。截止到2013年,通過人臉識別登出重復戶籍79萬個,其中最典型的案例一個人同時擁有8個身份。
人臉識別技術在公安系統內的逐漸大規模應用也推動了技術的逐漸發展。這一階段,國內涌現出許多專注於人臉識別的創業團隊。
曠視科技是其中一個,成立於2011年,並於2012年推出face++人臉識別雲平臺,這個如今已經與阿里巴巴合作推出刷臉支付的企業,在安防領域也有佈局。
“安防的應用是1:N,在N的庫裏識別出一個嫌疑人。一是大庫搜索,把監控照片放到庫裏,通過逆向搜索縮小嫌疑人的方向。二是布控,在關鍵地方,不需要警察蹲點。因為攝像頭都可以捕捉,而攝像頭都是聯網的,因此可以實現動態布控。”曠視科技有限公司市場與經營部總經理謝憶楠對21世紀經濟報道記者説。
“現在,各個地方公安系統都用了人臉識別技術,至今還沒有聽説過哪個地方沒有用的。”蘇光大這樣描述人臉識別在安防領域的應用規模。
商業化進程
有了在安防領域內的技術積累,人臉識別技術已經可以基本完成靜態的識別工作。但對於安全性的質疑也出現了,比如如何保證通過識別的是活體而非照片成了一個議題。
深度學習和神經網路的興起把人臉識別技術帶入了新的階段。2006年,多倫多大學電腦係教授Geoffery Hinton在Science雜誌發表論文,第一次提出了深度學習的概念。
深度學習,即機器學習研究中的一個新的領域,其動機在於建立、模擬人腦進行分析學習的神經網路,它模倣人腦的機制來解釋數據,例如圖像,聲音和文本。此後,深度學習在網際網路領域引起了廣泛的關注,微軟、Google等多家網際網路巨頭公司都對此進行了研究。
“真正在人臉識別領域用上深度學習並且取得突破是在去年。”一登團隊創始人沈洽金錶示。“它讓電腦模倣人的大腦去思維,在電腦學習的過程,演算法也得到了很大的改進,識別率大大提高。”
基於新的技術突破,一些綜合性應用也逐漸興起。
于3月公測的一登通過提供刷臉登錄,為用戶建立一個基於人臉的通用賬號,簡化、註冊登錄流程。也從一定程度上增加了用戶密碼被盜竊的難度。
沈洽金對記者表示,一登希望改善用戶傳統“密碼+賬號”的登陸體驗,讓人臉登錄成為一種普遍的方式。相比于傳統的密碼而言,沈洽金認為傳統密碼繁雜不易被記住,而人臉登錄可以在很短的時間內完成,流程簡單很多。
然而如何推廣是一登的一大難題。“沒辦法被普及,用戶的教育成本比較高。” 沈洽金説。
逐漸增多的娛樂化應用似乎從一定程度上增加了用戶的接受度。在接入一登SDK的141個應用中,有音樂類、娛樂類、新聞類等輕應用。
而以人臉識別技術為基礎開發的娛樂化app正在得到大量推廣。微軟推出的how old刷爆了朋友圈,美圖秀秀等利用人臉識別技術p圖也擴寬了應用;世紀佳緣交友網站也在2013年接入了人臉識別技術。
以how old為例,比如給機器100萬張不同年齡性別的照片,通過學習,機器會知道50歲、男人是什麼樣子。再通過回歸運算,歸納出規律,經過大量的學習,機器就知道了每個階段人的特徵。據了解,How old應用通過提取人臉72個關鍵點,來達到識別效果。
“娛樂化應用並不以識別率作為評價標準,只要滿足用戶的需求就可以了,應該稱之為人臉識別相關技術。但對於推廣人臉識別而言,娛樂化應用是很好的做法。”蘇光大説。
安全性難點突破
按照提取人臉關鍵點的能力劃分,目前有可提取關鍵點48個、72個和100個以上等不同種類。而關鍵點捕捉得越多,識別率也就越高。
隨著深度學習的推廣,有關人臉識別的演算法也在不斷優化。目前,以face++、騰訊優圖為代表的國內團隊都有了一套核心演算法,這使得國內人臉識別技術的識別率大大提高,有的公司甚至超過99%的準確率,在國際上處於領先水準。
技術的發展和産業的需求正好“相遇”。以餘額寶為代表的網際網路金融興起,網際網路金融對衝擊傳統業務模式産生了衝擊。
財付通高級總監、騰訊徵信總經理吳丹告訴21世紀經濟報道記者:“網際網路金融在過去一兩年得到飛速發展,迫切需要個人徵信體系作為支撐,其中用戶身份識別就是首要的,傳統金融中,用戶在申請銀行貸款或證券開戶時,均必須到實體門店上做身份資訊核實,完成面簽。”
今年年初,李克強總理來到深圳前海微眾銀行考察。和傳統銀行不同,微眾銀行作為國內第一家開業的網際網路民營銀行,無營業網點、無營業櫃檯、依託網際網路提供服務。在李克強敲下電腦回車鍵後,卡車司機徐軍就獲得了3.5萬元貸款。這是微眾銀行的第一筆放貸業務,通過人臉識別技術和大數據信用評級,完成貸款發放。
這無疑是一劑強心針,刺激了網際網路金融機構對人臉識別技術應用的想像力。
但人臉識別在金融領域和安防領域有所不同。“金融領域要求1:1驗證,即驗證你是你本人。這要求系統在驗證中有極低的誤失率和極高的通過率。”謝憶楠説。相比之下,安防領域主要是根據已有的庫內資訊,進行逆向篩選和識別。
他介紹,去年三四月份,螞蟻金服就主動找到face++合作。“他們迫切需要越過(面簽)紅線,我們也希望實現商業化。” 謝憶楠認為,face++的技術可以滿足金融機構的要求。
根據吳丹介紹,通過騰訊的人臉識別技術,用戶只需要打開手機攝像頭,自拍一張照片。系統將會做一個活體檢測,並進行一系列的驗證、匹配和判定,最終判斷這個照片是否是用戶本人操作,完成身份核實。
4月14日,財付通宣佈與公民身份證查詢中心合作,提升人臉識別的準確率及商業可用性。
據媒體報道,今年5月初,華林、長城等券商已獲得開展人臉識別應用試點的相關批文。“人臉識別遠端開戶還在測試階段,什麼時候應用,目前還沒接到通知。”華林證券的一位工作人員對21世紀經濟報道記者説。
更多的金融機構,包括銀行也逐漸開始對刷臉開戶感興趣。
謝憶楠介紹,face++目前已拿到多家銀行的訂單。然而在金融領域的推廣還面臨重重壓力,大多銀行更是持觀望態度,技術也僅停留在測試階段。
5月24日,在五道口“新常態、新金融”全球金融論壇上,央行支付司副司長樊爽文表示,未來對遠端開戶要堅持標準先行,一是先有“刷臉”(人臉識別)技術標準;二是,在此基礎上制定金融行業的行業標準。“只有這兩個標準有了,監管才能放心。”
0.5%的門檻
雖然相比于從前,人臉識別已經取得了很大的技術進步,但如果以人臉識別作為新一代的網路通行證,可能帶來的隱患也並沒有消除。
“使用生物識別,好處是無需記住密碼,也不存在弱密碼問題。不過它的特徵具備唯一性,一旦洩露很難更改,別人可以一直用你的身份授權,洩露了非常危險。” 國內網際網路安全漏洞平臺烏雲網的一位網路安全專家告訴21世紀經濟報道記者。
“身份認證是一個從採集生物資訊、提取已存儲資訊、對比校驗的過程,任何一個環節都有可能被攻擊者利用而達到不同的目的,從身份偽造到竊取認證資訊甚至到竊取生物資訊。”國內知名安全團隊Keen Team一位安全專家對21世紀經濟報道記者説。
他繼續表示,以蘋果、安卓為代表的智慧設備上的生物特徵並不會存儲在雲端上,而存儲于用戶設備中,由於生物特徵的高度敏感性,其使用場景應局限于用戶的終端。任何生物特徵上雲的方案和行為風險都很高,應該警惕。
對於如何保護數據庫不被駭客攻擊,他認為終端廠商應加強代碼審計,避免設備和邏輯漏洞的出現。在數據存儲方面,對生物資訊的存儲使用強加密不可逆方式,提高攻擊門檻。
烏雲網上述安全專家表示,廠商不應收集用戶的原始數據,可以用不可逆演算法生成的二次數據替代。
對此,謝憶楠介紹,目前face++已經形成了不可逆演算法生成的二次數據體系,駭客即使通過攻擊拿到了數據庫,也無法判斷更無法將其還原為一張人臉。
然而有關安全性的擔心並沒有停止,上述Keen Team的安全專家表示,在整容技術如此發達的今天,支付寶使用了人臉識別,如果他人整容成自己的樣子後刷臉,支付寶的錢就沒了。
並且在微光、強光、傾斜角度等條件下人臉識別的成功率不容樂觀。沈洽金告訴記者,目前一登已經可以實現在光線較暗的情況下認證的能力。但對於一些極端情況,如睡覺時被刷臉登陸等還無法克服。
雖然國內目前已到達99.5%的識別率,但依然有繼續提升的空間,而在現在的基礎上,每一個百分點的提升都比以往更加困難。(編輯 譚翊飛)