近日,線上少兒教育平臺VIPKID宣佈,其年新增課程數據量達到10PB,高峰時期併發課程量達到2.3萬節。這不僅反映了VIPKID課堂背後的高水準運維能力,也意味著在數據積累方面,VIPKID已經走在行業前列。
那麼,10PB(1PB=1024TB)數據量是什麼概念呢?如果把這些數據拷貝進硬碟,需要5120塊容量為2TB的硬碟,如果每個硬碟厚度為2cm,摞起來則相當於一棟102.4米高的大樓;10PB也相當於10個世紀頂級圖書館的數字資源總量(2015年),或者人類有史以來所有印刷材料數據總量(200PB)的二十分之一。
小學員在上VIPKID課程
數據對於網際網路企業的重要性不言而喻。馬雲曾在演講中提到,未來的時代將是DT的時代,DT就是Data Technology數據科技,顯示大數據對於阿里巴巴集團來説舉足輕重。對於很多行業而言,如何利用這些大規模數據是贏得競爭的關鍵。
以谷歌開發的人工智慧程式阿爾法狗為例,與圍棋世界冠軍、職業九段棋手李世石對戰之前,谷歌就為其輸入了3000萬步人類圍棋大師的走法數據,並讓其自我對弈3000萬局,這些海量的數據幫助阿爾法狗積累了人類難以達到的圍棋經驗,從而擊敗了人類圍棋世界冠軍。當前,VIPKID擁有超過30萬付費用戶和4萬多名北美外教,這也為智慧課堂的建立和持續優化提供了重要的數據來源。龐大的用戶數據使得VIPKID能深入了解學生的學習習慣,提升個性化推薦的準確度與效率,不斷為學生迭代個性化的學習路徑,保證了孩子學習效果的真實呈現。
從數據深度上來看,VIPKID的課程數據不僅包括孩子與外教的線上課堂互動視頻、自主研發的線上課件,也包含VIPKID通過人臉識別、語音語義識別等線上教學技術,對學生和老師的上課行為深度挖掘後産生的龐大數據量。也就是説,在VIPKID平臺上,一節課的數據不僅包括孩子和老師的上課視頻,也包括系統分析得出的學生和老師的行為數據,這些數據還將在後續的課堂中形成學習報告,為老師教學和孩子學習提供重要參考。
“這些數據可以更直觀地呈現每個孩子的學習情況,為學生個性化學習路徑的建立打下了堅實的基礎”,VIPKID技術副總裁張燕靜表示,將孩子的每一堂課、每一個學習行為記錄下來,再加以分析,最終的目標是為每個孩子提供個性化的成長參考,成為他們在未來學習中彌補弱勢,發揮優勢的依據,真正實現大規模個性化教育。
今年年初,VIPKID已針對每個用戶發佈了“愛學成績單”,成績單不僅有每個孩子在2017年的精彩上課視頻,還分析了每個學員在過去一年中的學習行為,包括上課節次、分鐘數、獎勵獲得、繪本閱讀、學會的單詞數量及一起上過課的北美外教等數據,有家長認為,“所有的這些數據,都是孩子在成長路上不可或缺的一個個‘腳印’。”
(責任編輯:張明江)