長按識別二維碼,報名2018十大突破性技術中國區線下解讀會
圖像分類技術在過去幾年中取得了顯著的進步,這在一定程度上體現在Imagenet 分類挑戰上,機器的誤差率每年都在大幅下降。
為了繼續推進計算機視覺技術的先進水平,許多研究人員現在更多地關注細粒度和實例級的識別問題,而不是識別一般實體,如建築物、山脈,當然還有貓,許多人正在設計能夠識別 埃菲爾鐵塔、富士山或波斯貓的機器學習算法。
然而,這一領域研究的一個重大障礙是缺乏大量帶註釋的數據集。
而就在今天,谷歌在其官方博客宣布,發布 Google-Landmarks 數據集來推進實例級的識別,這也是世界上最大的人工和自然地標識別數據集。
Google-Landmarks 將作為 Kaggle 網站上地標識別和地標檢索挑戰發布,這將是 CVPR 18 地標研討會的重點。
該數據集包含二百萬多幅圖像,描繪了來自世界各地的三萬處獨特的地標,數據集類別的數量比常用的數據集大 30 倍。 此外,為了促進這一領域的研究,我們是開源的深度本地特徵( DELF ),我們認為這是一種非常好的本地特徵描述方法,特別適合於這類任務。
地標識別與其他問題有一些顯著的區別。 例如,即使在大型帶標註的數據集中,對於一些不太熱門的地標,也可能沒有太多的訓練數據。 此外,由於地標通常是不動的物體,所以內部變化很小(換句話說,地標的外觀在不同的圖像中變化不大)。
因此,變化只會由於圖像捕獲條件而產生,如遮擋、不同的視角、天氣和光照,這與其他圖像識別數據集不同,其中特定類別的圖像(如狗)的變化可能更大。 這些特徵也與其他實例級識別問題(如藝術品識別)有共同之處,
因此,谷歌希望這個新的數據集也能對其他圖像識別問題的研究有所幫助。
這兩項 Kaggle 挑戰將為研究人員解決這些問題提供了獲取帶標註的數據的途徑。 識別軌跡挑戰是在測試集中建立識別正確地標的模型,而檢索挑戰則要求參與者檢索包含相同地標的圖像。 通過 Kaggle 網站就能訪問到這個新的數據集。
-End-
編輯:LXQ 校審:黃珊
參考:
https://research.googleblog.com/2018/03/google-landmarks-new-dataset-and.html?m=1