12306將剔除辨識率低圖形驗證碼
- 發佈時間:2015-12-11 08:14:54 來源:新京報 責任編輯:湯婧
昨日,中國鐵道科學研究院,研發12306票務系統的技術人員正在測試手機端的圖片驗證碼的運作狀況。
12306票務系統的研發中心內,一位技術人員正在實時檢測網站數據。
12306購票網站上一些驗證碼引爭議。
12306購票網站上一些驗證碼引爭議。
12306驗證碼變遷
簡單數字→數字加字母→加減法算式→閃爍變形字母(動態碼)→中間添加干擾線的變形字母→圖形驗證碼
目前正值春運購票高峰,網路上流傳一些調侃鐵路購票網站12306圖形驗證碼的帖子,稱圖形驗證碼難辨識、一些物品名稱沒有聽説過等。對此,12306相關負責人昨日向記者表示,為防止搶票軟體自動識別,相關圖形做了技術處理,但未來將會剔除一些辨識度低的圖片。
圖片技術處理為防搶票軟體
“12306的驗證碼,已經擊敗了全國99%的購票者,我已經找不到回家的路了。”近日,春運購買火車票期間,不少網友發帖吐槽12306的圖形驗證碼。網上甚至還流傳一些“奇葩”驗證碼的帖子,列舉出識別明星臉、罕見物品等刁鑽問題。
昨日,中國鐵道科學研究院電子計算技術研究所副所長朱建生表示,12306購票系統沒有所謂“識別明星臉”的“奇葩”驗證碼,網上流傳的刁鑽問題大多子虛烏有。“我們決不會讓旅客分辨‘橘子’和‘橙子’。”朱建生説。
不過,也有一些網友表示,驗證碼清晰度不高,導致放票時間連續選錯,從而錯過了購票。朱建生表示,在春運返程訂票高峰12月15日前,還將對驗證碼中數萬張圖片進行優化,剔除一些辨識度不高的圖片,提高圖片的清晰度。
“為了防範搶票軟體的自動識別,我們會對圖片做出微調、旋轉、切割的處理。這樣做主要是為了在方便旅客購票和打擊搶票軟體中尋找平衡。”朱建生説。
部分網友吐槽一些圖形驗證碼因為生活環境和習慣問題,“南方人不認得北方人的物品,北方人也不認得南方人的物品”。朱建生解釋稱,12306圖形驗證碼選擇的都是生活中常見的物品,由於地域原因,“南方人沒見過或北方人沒見過的,或各地叫法不同的,未來在優化時都將進行篩除。”
“圖形驗證碼有利於普通人訂票”
朱建生介紹,後臺數據顯示,今年網站購票的平均排隊等待時間僅為1.8秒,系統運作穩定,運作效率大幅提升。同時,對於驗證碼的正確識別率,朱建生表示,正確填寫圖形驗證碼的幾率在70%左右。
12月9日10時的相關分析圖顯示,該時段,共有44萬人輸入圖形驗證碼,其中有33萬人輸入正確,正確率在75%。今年春運購票最高峰的12月8日,當日11時,旅客驗證碼輸入的正確率是69%。
“登錄的人少了,成功出售的票數增加了,這説明無效地、重復地登錄網站的少了。”朱建生表示,過去的數字字母識別碼,一些搶票軟體和公司開發的瀏覽器很容易進行分析,並自動跳過驗證步驟。在人眼識別需要2秒的情況下,機器僅用0.1秒就能識別。“在高峰時段,相隔這樣的時間,也會造成旅客買不到票。”
朱建生説,圖片識別對普通人而言更加便利,人腦更容易建立問題和圖片間的聯繫,而機器則有一定困難。
購票時間縮短至開車前半小時
據中國鐵路總公司統計,自11月26日發售春運第一天車票起,截至12月9日,鐵路部門共發售車票1.3億張,同比增長9%。近九成通過網路訂票成功。
今年,鐵路部門還將採取多項新舉措方便學生、務工人員等群體購票。目前,鐵路部門已累計發售節前學生票804.8萬張,同時已兌現各院校通過網際網路提報的學生團體往返票計劃。
“從今日起,未購買到車票,也未參加院校統一辦票的學生仍可通過鐵路各渠道零散購買明年1月10日至2月29日期間的學生往返車票。”中國鐵路總公司運輸局營運部副主任黃欣表示。
為方便務工人員購票,鐵路部門今年取消了5人成團的限制,單個旅客也可申報購票計劃,目前鐵路部門正在受理用工企業和零散務工人員提報的春運期間往返購票計劃,將於12月15日完成計劃兌現。
12月16日-25日,用工企業可登錄務工人員團體票辦理網站查詢結果,零散務工人員可根據手機短信提示,到鐵路任意窗口憑乘車人二代身份證原件辦理支付並取票。
此外,鐵路部門今年還將網際網路購票時間由不晚于開車前2小時調整為不晚于開車前30分鐘,同時推出了變更到站服務,在列車上提供了聯網升座服務等。
■ 焦點
驗證碼技術公司否認準確率8%
公司負責人回應質疑,稱圖形驗證碼能抵禦大部分黃牛;圖庫會不斷增替
正值春運搶票潮,12306購票系統推出的圖形驗證碼飽受吐槽,部分網友將矛頭指向為該系統提供驗證碼服務的企業,質疑“圖形驗證碼”方式未完全阻擋黃牛,還貼出黃牛黨購票的訂單圖。另有網友跟帖稱,這一技術並非原創而是抄襲谷歌。此外,還有網友稱官方未披露相關招標項目和費用等細節。
對此,新京報記者了解到,為12306系統提供圖形驗證碼服務的是杭州微觸科技有限公司。該公司官網顯示,除鐵路12306外,其用戶一欄中還包括“中國郵政”、“金山快盤”等圖標。
該企業的工商資訊資料顯示,杭州微觸科技有限公司自2012年9月成立並開始營業,註冊資本為30萬元人民幣,法定代表人為宋超。新京報記者檢索發現,宋超名下還有一家名為北京點觸互聯科技有限公司的企業,于12月3日剛剛成立,註冊資本為100萬元。
對於網友的質疑,昨日宋超表示,除偶爾有較難識別的圖片外,圖形驗證碼能夠抵禦大部分的黃牛。
1 圖形驗證碼數據庫洩露?
圖片數量並非固定,為動態增替
據知情人透露,12306官網推出圖形驗證碼,原本是為了攔截技術黃牛,“但實際上只是攔截了一部分。”
據其透露,圖形驗證碼推出沒多久後,就有人將圖形驗證碼後臺數據庫竊取,並建立了“打碼平臺”。黃牛購票時,只需通過打碼平臺打碼,即可繞過圖形驗證碼這一關卡。其稱目前打碼平臺的打碼識別率已超過90%。
他介紹,黃牛每打碼一次,就需要付1分至5分不等費用給打碼平臺,而黃牛每購買一張票,通常需要打碼十幾二十次,多的時候打碼上百次。
同時,近日360瀏覽器也宣佈,已全面攻破了12306圖形驗證碼,實現了全自動識別技術,並首次公佈了581種12306圖形驗證碼大數據。
對此,杭州微觸科技有限公司負責人宋超表示,圖片的數量不是一個固定的數字,是不斷動態增替的過程,會“自己不斷通過用戶的使用數據來更新。”他介紹,系統每天都會抓取大量的圖片,“通過用戶的選擇,用戶驗證的過程,會自動幫助系統通過機器學習獲得新的圖庫,安全性會隨著驗證量的提高而自主提升。目前我們已經通過驗證系統自動標示了近千萬的精準圖片,用戶的每一次驗證都在幫助人工智慧在圖像識別領域添磚加瓦,訓練機器學習。”
2 一次性準確識別率僅8%?
網傳“奇葩”驗證碼為PS合成;後端數據顯示成功率非常高
按照360瀏覽器提供的大數據,12306網站的購票驗證碼一次性輸入準確的比例為8%,兩次輸入準確的比例為27%,三次甚至4次以上輸入準確的比例為65%。
360技術人士稱,在12306推出複雜驗證碼時,他們通過技術手段對其進行集中統計後發現,其一次識別通過率處於不穩定的狀態。部分生僻圖片難以辨認和12306進行的不合適的圖片處理,造成整體識別率降低,在一些時段上,識別率甚至不足5%。
技術人士表示,從技術上講,這種方式具有一定的創新性,複雜的圖形驗證碼,提升了自動識別的技術門檻,但其圖片品質較差,再加上有一些生僻且容易混淆的圖片以及不合適的圖片處理,造成用戶體驗較差。客觀來説,12306複雜驗證碼確實對打擊黃牛起到了一定的作用,例如其對部分驗證碼進行模糊顆粒化處理,可以防止黃牛採用專用搶票軟體來刷票。
針對部分網路公司提出的驗證碼成功率低的情況,宋超稱,公司點觸驗證碼的産品相對成熟,後端數據顯示成功率非常高,除部分特別難識別的圖片外,網傳的一些“奇葩”驗證碼圖片幾乎均為PS合成製作。
3 與鐵道部門合作前後股權變動?
創業公司有人離開有人加入很正常
有網友指出,鐵路系統開始使用圖形驗證碼是在今年3月份左右,而該公司作為技術提供方,在鐵道部門開始使用圖形驗證碼前後,公司股權立即發生變動,“大致為刪除一人,增加一人。”
宋超在今年5月份接受媒體採訪稱,每個創業公司都會經歷瓶頸,之前有一段時間公司發展困難,資金流出現緊張。一名同學看不到希望,跳槽走了。
“創業公司很苦,有的因此離開,也有因為願意一起朝著目標努力而加入,是很正常的事,”他稱,現在後臺可以支援起每天3億以上的請求,“系統比往年一定要增強,”他們目前還在吸納更多的技術人才加入,在驗證安全、賬戶安全、密碼安全和行為安全方面,完成用戶資訊安全保護的全面保障。
4 圖形驗證碼技術是否抄襲谷歌?
自稱2012年提出圖標式驗證碼,谷歌2015年提出
有網友稱,這種圖形驗證碼技術並非原創,而是抄襲谷歌。
據多家媒體此前報道,2011年,宋超在哈爾濱工程大學念研究生時發現了驗證碼的“BUG”,此後,宋超與其他幾名學技術的同伴憑藉自主研發的“點觸驗證碼”和“點觸雲安全系統”參加新媒體創業大賽獲獎,得到數百萬元的天使投資,此後他休學並成立了杭州微觸科技有限公司。
據報道,“點觸驗證碼”是將傳統驗證碼中模糊的背景換成清晰圖片,上面是隨機排列的標識(漢字、數字、英文字母、有意義的圖標等),用戶通過按照要求點擊(或者觸摸)圖片上指定的位置,完成驗證。該項目已經擁有3項專利。
“我們在2012年提出了圖標式驗證碼、圖文驗證碼和滑動驗證碼和旋轉式驗證碼,結合行為安全控制,並一直在優化演進,目前有5萬多家網站在使用點觸的服務,谷歌是2015年初才提出的圖標驗證,説我們抄他們的不是冤枉嗎?”宋超稱,微觸很早即開始進行點觸驗證碼的開發工作,自2012年開始公司化運營,現在已經在北京建立了公司,專注于用戶資訊安全和隱私安全。
■ 聲音
如樣本足夠存破解可能
網際網路專家史文勇認為,圖形驗證碼技術確實比平時的文字驗證更加複雜,但他並不認為圖形驗證能夠起到實在的作用,“有些軟體能夠自動將所有出現的圖片配對好,很難説能夠防止黃牛刷票。”
他稱,在利用相關軟體刷票能夠比常規買票速度更快的情況下,一些購票者也會尋求軟體的幫助。
“人多票少,有一些技術人員刷票能比個人更早買到票,任何工具都無法百分百防止。”梆梆安全創始人兼CEO闞志剛稱,實際測試表明,借助於谷歌等巨頭的智慧識圖技術,能夠識別大部分圖片的涵義,準確率達85%,如果採集樣本數據足夠大,確實有破解圖形驗證碼的可能性,一旦圖形驗證碼被黃牛破解,他們就可以繼續刷票。
他表示,確實圖形驗證碼在識別上增加了難度,但破解難度上面並沒有革命性的改變,應該建立多種聯合機制抵制黃牛刷票行為。
■ 追訪
訂票高峰會“癱瘓”嗎?
每秒可承載上萬訪問,高峰期運作順暢
昨日,記者隨中國鐵道科學研究院相關人員參觀了12306購票系統的後臺。監控大廳的顯示屏上,顯示了鐵路總公司和鐵科院兩個生産中心的實時運作數據。這些數據包括網站、手機APP的實時登錄人數,購票支付情況、車站取票情況等。
“春運期間,購票數據每半小時就會出現一個尖峰,這顯示了我們每天21個放票時間段的高峰購票情況。”中國鐵道科學研究院電子計算技術研究所副所長朱建生告訴記者,系統從每天7點開始運作,一直持續到24點停止支付。
朱建生介紹,12306網站每秒鐘可承受上萬次訪問並保持系統平穩運作。“12月8日高峰期,全天16個小時訪問量是3600萬,到每秒鐘不到1000次訪問,這完全在網站設計的承受範圍內。”
同時,據12306後臺系統相關數據,今年12306網站在12月8日最高峰當天登錄用戶達3600萬,旅客成功購票數是608.7萬張。而去年在購票高峰期,登錄用戶有5600萬,售票僅為563萬張。
為何仍“一票難求”?
增開列車調整運作解決供需矛盾
昨日,記者詢問12306相關負責人,對於此前媒體報道的“記者買不到票,而黃牛仍然能買到票”的事情,相關負責人表示,圖形驗證碼在一定程度上阻止了黃牛搶票、囤票,但黃牛可能利用更大的頻寬、更快的網速專業從事搶票。
“一些第三方平臺和軟體還利用未註冊的實名旅客資訊進行搶票、囤票,鐵路部門將對此事採取相關措施。”黃欣也提示旅客,不要使用這些平臺買票,以免個人資訊洩露。
朱建生表示,後臺仍然從技術上監測到一些試圖破譯12306圖形驗證碼的情況,未來不排除對驗證碼系統進行再次改進升級。
鐵路部門介紹,提高鐵路運力是最終化解供需矛盾的重要方向。今年春運,鐵路部門每天開行旅客列車3488對,比2015年春運增長14.5%。其中,圖定旅客列車3048對,春運增開旅客列車440對。
“12月16日增開的列車投入後,以及一些運作圖調整,再加上一定的退票,現在沒買到票的旅客到時還會有票。”朱建生説。