新聞源 財富源

2024年11月23日 星期六

財經 > 滾動新聞 > 正文

字號:  

搜狗搜索“大開放” 輸出12306驗證碼識別技術

  • 發佈時間:2015-12-16 01:32:33  來源:北京晨報  作者:佚名  責任編輯:羅伯特

  目前,12306網站已開始發售除夕及返程車票,春運搶票進入衝刺期。日前,搜狗瀏覽器、QQ瀏覽器等應用相繼推出搶票功能,“一鍵搶票”讓春運買票這件事變得輕鬆簡單,而助力這些“搶票神器”解決搶票關鍵問題,訂票成功的技術支援,正是搜狗搜索響應“大開放”戰略,輸出給合作夥伴的“圖像驗證碼識別解決方案”。

  此前,搜狗CEO王小川在參加2015中國企業領袖年會時表示,“大開放”是網際網路未來發展的重要方向之一,封閉和創新是一個硬幣的兩面,封閉會促發創新;而當一個公司創新力不足時,又需要用一種新的方式提高效率走向開放。搜狗將以開放的姿態打破“圍墻”,輸出技術與更多優質的網際網路公司合作,提升資源整合的效率。

  此次搜狗搜索開放12306驗證碼識別技術,也是繼搜狗戰略投資知乎,在資本和産品、技術層面深度合作後,再一次踐行王小川的“大開放”戰略,通過在搜狗瀏覽器、QQ瀏覽器等産品上應用“圖像驗證碼識別解決方案”,為一鍵搶票功能實現解決關鍵問題,有效提升瀏覽器搶票功能的效率,惠及廣大用戶。

  而購票第一關的打通,正是應用了搜狗搜索開放的“圖像驗證碼識別解決方案”。憑藉搜狗深厚的識圖搜索技術積累,和強大的大數據處理能力,該方案打出了“OCR技術+圖像分類技術”組合拳,對圖像匹配驗證碼的識別正確率可達99%,並能在0.3秒內可極速完成識別。

  首先,要正確識別12306驗證碼,首先要讀懂問題中的文字,這就需要採用OCR技術,即光學字符識別技術。OCR識別的步驟可以分為兩步:首先是文本檢測(Text detection),將文字從圖片中提取出來;然後,對文本進行識別(Recognition)。搜狗輸入法的拍照輸入、搜狗搜索的識藥方等功能,應用的正是搜狗領先的OCR技術。

  其次,還需要對候選圖片進行識別判斷,基於深度學習和大數據分析處理能力的圖像分類技術正好解決這一問題。在OCR技術的基礎上,搜狗搜索借用了圖像分類的思想,首先將經過變形處理的描述文字圖像通過OCR技術識別成文本,再通過圖像分類技術,對於多張候選圖像識別出其分類資訊,然後將文本和分類資訊進行自動匹配,從而實現驗證碼的自動識別過程。

  搜狗搜索技術負責人表示,此次為搜狗、QQ瀏覽器等應用的搶票功能提供技術支援,可謂在踐行“大開放”戰略上邁出了第一步。搜狗搜索將秉持“真正開放”的態度,願意為其他有相關需求的合作夥伴開放API介面,提供更多技術支援。劉敏

熱圖一覽

  • 股票名稱 最新價 漲跌幅