“這大概是人臉識別被黑得最慘的一次。”
在“誤識董明珠”事件背後,人們得以再次窺見人臉識別技術應用的局限性,尤其在環境複雜的室外和路口場景。
紅綠燈路口人臉識別系統首先在2017年落地,以部分大中型城市作為試點,在這之後對於該套系統的可信度有多少、存在多大實際價值等追問一直沒有停止……藉此次事件集中 探討。
昨天,寧波交警行人闖紅燈曝光台的照片在網絡社交平台火速流傳:大屏幕中出現了知名女企業家、格力電器董事長兼總裁董明珠的照片,旁邊還展示了她在“橋東違法闖紅燈” 。
對照該照片所處的場景和位置,可以發現是人臉識別系統出錯,將噴塗在大巴車上的董明珠廣告人像錯當橫穿馬路的路人記錄,鬧了個大烏龍。
寧波交警對此回應稱,這屬於人像誤識別,對此已經刪除,技術人員已經對系統進行了升級、減少誤識別率。
值得注意的一點,曝光台上識別到的該路人身份名稱為“巨**”,這明顯不吻合董明珠的真實身份,可見該套人臉識別出現的錯誤不止一處,其中包括:
一、將董明珠的照片識別為“巨**”。 根據工商信息查證,格力電器董事長兼總裁董明珠確實叫“董明珠”,即在公安的人像底庫中,董明珠的身份也應該顯示為“董明珠”,但人臉識別系統卻將其 識別為“巨**”。
二、將移動的靜態的廣告牌人像識別為“闖紅燈的路人”活體。
筆者根據公開報導統計,該套方案自2017年年初開始就已經在國內超過十餘個城市地區鋪設,全國多地交管部門都引入了類似系統已規範行人遵守交通法規,其中落地城市既包括深圳、 上海等一線城市,也有西安、濟南、寧波、武漢等二三線城市,以及宿遷等重點三四線城市。
但是,這些方案僅局限在部分市區和路口的落地,約為數十個至百個數量級,並未大範圍地推廣至城市級或者區域級。
比如,濟南市自2017年5月3日實施人臉抓拍系統以來,一共抓拍了6213起行人、非機動車闖紅燈違法行為。 未來,濟南將在全市約50個主要路口安裝該系統,同步配套啟用的還有實時曝光屏、闖紅燈預警系統,以及機動車不禮讓斑馬線抓拍系統。
深圳曝光了從2018年3月8日至3月12日,在同一地點新洲蓮花路口東側發生的15起行人闖紅燈事件。 涉事行人都是在闖紅燈時,被監控抓拍下來,再通過人臉智能識別,識別出涉事行人的身份信息,予以曝光。
該套方案的主要內容包括:
首先,紅燈亮起時,啟動人臉檢測系統;
然後,攝像頭檢測道路上是否有行人越過停止線,並針對該行人的人臉進行拍攝,系統會自動抓拍4張照片,保留15秒視頻,並截取他的頭像;
最後,將照片載入公示的大屏幕,滾動播放。
針對抓拍後受是否進行身份識別可將該套解決方案分為兩種類型:只抓拍不實時識別;抓拍並實時識別,連通戶籍信息或者身份信息。
後者的應用場景難度比一般的動態布控系統更高。 因為一般的安防應用場景,重點人員的數量通常比較少。 但兩種解決方案的最核心目的都是為了起到震懾作用,警示民眾闖紅燈行為可能帶來的懲戒。
比如,對於行人及非機動車闖紅燈行為,交管部門可能給予20元、50元的處罰,或者將該信息記錄進個人誠信檔案。 從現階段落地情況來看,大部分的紅綠燈人臉監控系統均實現了抓拍和識別的聯動。
根據央視新聞等公開資料顯示,該套系統可實現:
從抓拍到身份識別整個過程只需10秒鐘,人臉識別準確率超過90%。
交警總隊科技處民警戚悅介紹,這套系統不僅能夠實現抓拍取證,還能識別違法人員的身份信息。 即使在夜間也能清晰成像。 一般情況下駕駛人戴頭盔、墨鏡或口罩等乾擾,也不影響圖像與後台數據庫比對。
被“打臉”的是誰?
對於該問題的第一個爭論焦點便落在這套人臉識別系統採用的是哪家供應商,哪家AI公司提供的技術支持?
首先,談到人臉識別領域的AI公司,四小龍最先躺槍,依圖的算法被認為算法精度最高。
本週,美國國家標準與技術研究院公佈的全球人臉識別算法測試結果,依圖科技以千萬分之一誤報下的識別準確率超過99%,繼續保持全球人臉識別競賽冠軍,商 湯科技摘得第三名和第四名。
商湯和曠視在政企安防市場分別佔據一定市場,商湯曾參與深圳市智慧交通項目建設。 此外,有知情人士表示,深圳市龍崗區深圳交警這套系統由雲天勵飛承建一部分,新聞中的攝像頭上有他們的Logo。
“闖紅燈這類項目有特定的部分公司‘擅長做’。”
“寧波屬於江浙一帶,那裡應該是海大宇的地盤。”
其次,對於活體識別準確度不高的問題,基於此前防攻擊的活體檢測的手段和案例可以看到,主要可以從算法優化、物理硬件攝像頭升級、主動配合等三種方式攻克。 但是是否能夠應用到室外複雜場景中的紅綠燈上呢?
現階段看來,該操作性基本可以否決。
一是目前針對活體檢測的防御手段主要針對近距離的人臉識別和檢測;
二是將普通攝像頭升級至紅外、3D攝像頭的成本過高,尤其是3D攝像頭;
三、要求行人主動配合的方式更加不可能實現,但加入運動檢測的方法,針對前後兩張圖片做差分可能識別到運動的物體,但也可能誤識到沒有闖紅燈的運動行人。
震懾之外,可信度有多高?
最後,也是最為核心的問題,結合技術能力與產品邏輯分析,在紅綠燈路口進行人臉識別所檢測到的數據結果究竟有多少可信度?
儘管行人和非機動車闖紅燈同樣是違法行為,但由於取證困難,一直以來管理和處罰都比較難。 考慮到人臉識別被很多人認為是個成熟領域的問題,參考車牌識別的邏輯,於是有了紅燈綠路口人臉識別的方案。
人臉識別主要包括兩大類:a.人臉驗證;b.人臉識別。
通過刷臉驗證是否和身份證為同一人,可以設置一個閾值,比如有9成把握兩者一致,就可以放行了。 目前主流算法是通過卷積神經網絡提取人臉及身份證人臉的特徵,經過相似度比對確定是否為同一人。 在一些公開學術人臉數據庫榜單上,比如LFW人臉驗證上達到了99.83% 的精度,已經超過了人類。
然而在大規模人臉識別中,挑戰依然存在。
路口的應用場景就屬於後者。 目前公開的、最大的人臉識別數據庫是MegaFace,達到百萬級別,是目前全球最大的公開人臉識別測試集,也是目前最為權威熱門的評價人臉識別性能,特別是海量人臉識別檢索性能 的基準參照之一。
這項賽事中有項挑戰是在百萬級別人臉數據中進行識別測試。 目前排名第一的算法在此項測試中達到98%的精度。
識別闖紅燈這套系統要在億級甚至十億級規模的干擾里達到報導裡聲稱的90%的rank1識別率,可信度不高。 “10^9的樣本是非常擠的,即便在一個完美的特徵空間裡都未必能取得90%的rank1識別率,更何況還有光照、姿態和路人戴墨鏡等問題。”相關研究員分析。
那麼,這套系統在業務上是否存在減小搜索空間的可能?
實際上,在很多機器代替人力的場景通常都會保留人工干預的空間。 例如可控環境下的人臉識別已經可以在非常小的誤識率的情況下取得比較理想的準確率。 在涉及安防這些不能犯錯的場景中,系統還是會選擇把困難樣本交給人去處理。
說到底庫為16億人像,比對的難度並不是問題。 數據庫和比對算法都是可以優化。 簡單來說,是在本地人佔90%的情況下,把數據庫限於本地人。
參考電子警察,部分困難樣本由人工來進行後台審核。
但是,電警審核一般是離線審核,比如這週拍的片子留到下週審核。 而該系統有實時性要求,跟電警不太一樣。 另外電警審核難度不大,這套系統對人臉分類的準確度要求估計早已超過人腦極限了。
曾參與上海城市級安防布控項目的行業人士表示,在職的時候捕獲率、識別率都不高。 一天也沒幾張,按老東家的套路必然後台會審核的。 審核是肯定會有的,目測審核的人力成本還是挺大的。 只把抓到的人臉實時顯示出來就行了,至於身份信息,還有很多人工要做才能確認的。
有參與該類項目的真身表示,政府採購都有極其嚴格PK流程和評判指標,可靠性是絕對不用質疑。 我們的證件照底庫是16億。
“這套系統主要抓附近居民,結合地理信息,只檢索附近幾個小區,而且不一定要抓多準,只要能抓幾個典型,威懾一下就好。”有行業人士認為,這類項目僅 作為試點推行,目前人臉識別系統主要適合做跨攝像頭的罪犯跟踪等,單純抓人臉,攝像頭的分辨率也的確不夠看的,平均50*50像素大部分廠商都無法做到。
“這根本不是識別率的問題,而是闖紅燈這種場景根本不適用人臉識別。”有從業者提出質疑。
一是技術準確性影響無法作為證據使用。 這項技術是1:N的人臉庫檢索匹配,即便出來的結果也只是給出相似人臉案例,並不能保證100%準確,在法律上是無法作為證據使用,只能列為嫌疑。 而攝像頭在抓拍的過程中,受到角度光線移動速度等影響,採集的質量不如對著地鐵扶梯抓拍實在。
二是海量檢索的時間、及人力成本太高。 如果非逃犯,用來做違章過濾後,還需要進行進一步的人工排除,組合其他攝像頭位置進行組合匹配,再進行進一步確認,人力成本太高。
安防從業人員認為,這個東西是否有意義已經不是簡單的技術問題了。
一方面工程角度有太多難題,人臉識別最大的難點就在相機拍攝環境,即光線變化,角度等,其次就是面部特徵的變化可能性太大。
另一方面是算法要滿足室外、一次/多次拍攝等要求,即使在行人再識別也沒有達到非常理想的程度。
結語
從海量的樣本中,去篩選這一個闖紅燈的人。 精度要達到多少才能滿足要求呢?
比如從百萬級ID照片中,識別這個闖紅燈者的照片,精度即使做到99.9%,那麼平均還有上千人被誤判,或者說,只能篩選出一個包含上千個體的集合。 但是針對行人檢測的數據庫搜索是10億級別的,如果只考慮一線城市,至少也是千萬級別的。
而現在,這個準確率只有90%。
人臉識別技術並非萬能,即使在舞台最大的安防產業,人臉識別技術所能發揮的角色也有其限制。
本文由 技術與商業© 授權 虎嗅網 發表,並經虎嗅網編輯。 轉載此文請於文首標明作者姓名,保持文章完整性(包括虎嗅注及其餘作者身份信息),並請附上出處(虎嗅網)及本頁鏈接。 原文鏈接:https://www.huxiu.com/article/273107.html
未按照規範轉載者,虎嗅保留追究相應責任的權利