綁定帳號登入

Android 台灣中文網

Android 台灣中文網 新聞資訊 3C資訊 查看內容

Google街景是如何識別門牌號的?

2014-1-14 15:39| 發佈者: kimiko| 查看: 368| 評論: 0

摘要: 知道Google 街景是如何識別各種千奇百怪的門牌號的嗎?靠的是它搭建的一個瘋狂的神經網絡。我們知道,在受約束環境下(如文檔處理)的字符識別技術,比方說OCR 技術已經被研究得很透。但是對照片中的多字符文本識別 ...

知道Google 街景是如何識別各種千奇百怪的門牌號的嗎?靠的是它搭建的一個瘋狂的神經網絡。

我們知道,在受約束環境下(如文檔處理)的字符識別技術,比方說OCR 技術已經被研究得很透。但是對照片中的多字符文本識別卻是個難題,因為這些照片中的字體、顏色、樣式、方向、排列不一,再加上光照、陰影、鏡像、遮蔽等環境因素影響,還有圖像本身的分辨率、焦點模糊、抖動等問題。而傳統的圖像文字識別,一般要經過字符定位、分割和識別三個步驟,處理效率不高。考慮Google 街景的每天上傳的圖片量,以往的這些方法顯然缺乏實用價值。

為此,Google開發了一套大型的神經網絡來處理海量的Google街景圖片中的門牌號識別問題。這個神經網絡的代號是DistBelief,其學名是深度卷積神經網絡,我們之前曾介紹過這套會思考的深度學習系統。經過DistBelief訓練的這個大型分佈式神經網絡,可以把定位、分割和識別三個步驟集成到一起,直接對每一個像素進行操作。其性能隨著神經網絡的深度增加而提高,在11層的時候達到最高。


根據論文的數據,該系統對SVHN(街景門牌號數據集)中的門牌號識別率達96%,而單數字識別率達97.84%,對於Google 街景圖庫的上千萬門牌號的識別率也超過90%。該系統每天可識別百萬門牌號(不到1 小時即可將法國的街景照片中的門牌號找出來)。目前該系統已經幫助Google 從街景圖中分析出全球近1 億個門牌號。

今日熱門
    推薦內容