柏睿數據國內首創MPP記憶體數據倉庫完成千萬級融資
- 發佈時間:2015-01-09 14:05:51 來源:新華網 責任編輯:羅伯特
柏睿數據國內首創的海量並行MPP記憶體數據倉庫RapidsDB近日已經完成了數千萬級的Pre-A融資,領投機構為藍馳創投,這也是國內頂級基金藍馳創投在大數據核心技術方向上插下的一個重要旗幟。
眾所週知,傳統企業級記憶體數據庫尤其是MPP記憶體數據倉庫由於技術壁壘非常高,市場一直由Oracle、SAP HANA、Teradata這三家數據庫巨頭牢牢把控。國內數據倉庫領域,迄今為止還沒有一家國産廠商在純關係型MPP記憶體數據倉庫方向上形成技術突圍,此次柏睿數據在技術上的成功突圍可謂是中國數據倉庫領域的“諾曼底反攻”。
傳統基於SMP關係型數據庫發展時間久,理論成熟,但是面對移動網際網路時代的大數據讀寫、高併發訪問以及頻繁的橫向擴展需求,基於SMP關係型數據倉庫由於擴展性差、升級昂貴等原因已經頻顯乏力。而前幾年雖然新興的NoSQL等非關係型數據庫以更靈活的數據組織形式和分佈式存儲等特點有所表現,但由於捨棄了數據間的關係特性,則根本無法滿足基於大數據的海量分析需求。
柏睿數據的RapidsDB 是一個新型的基於分佈式記憶體的數據倉庫,和亞馬遜新近收購的ParAccel一樣,屬於全記憶體的分析型數據庫。與 ParAccel不同的是,柏睿數據的RapidsDB完全針對的是企業級用戶,因此更完整支援TPC-H及TPC-DS的SQL語法,同時還加入了其他頂級數據倉庫公司少有的流數據操作功能,這使得企業級用戶能輕易的駕馭以鍵值存取的移動網際網路流數據及物聯網機器數據。
“數據倉庫這個領域本身門檻就很高,鮮少有人能真正在産品功能上實現,尤其是MPP架構的數據倉庫由於技術分支基本就來源於貝爾實驗室及UC Berkeley,所以産品開發的關鍵還是在於開發人員的素質,雖然我們的起步比國外晚些。”柏睿數據的創始人劉睿民先生向記者介紹道,“但我們的後發優勢非常明顯,尤其是大數據對MPP數據倉庫的需求跟以前的要求有了根本的區別,現在的數據量在以萬倍數的增長率增長,這是我們在研發過程中一直關注並致力於解決的核心問題,我們的這個産品能快速推出符合當今大數據快速處理需求的功能和特性,我們産品數據處理速度是現有技術的50倍,這就意味著我們在處理海量數據時,現有技術10幾個小時才能處理完的數據,用我們的産品在10分鐘左右的時間,甚至秒級即可處理並得出結論,這對於以數據分析為核心競爭力的企業用戶來説,反應時間就是市場、就是金錢。你比別人反應快,你佔領市場的速度就比別人快,你必然比競爭對手更具明顯競爭優勢”。
公司創始人劉睿民創辦公司前,曾任多家世界級跨國IT公司的大中國區及亞太高管,並曾在國內上市公司華勝天成擔任CTO,歸國前在矽谷Tandem公司師從圖靈獎大神級得主Jim Gray,共同參與過Tandem NonStop SQL/MP的內核編寫。據業界權威人士介紹,Tandem公司的MPP分佈式數據庫迄今為止依然在歐美的高端市場傲視群雄。
“MPP記憶體數據倉庫與基於SMP的關係型數據倉庫依然會有一段時間長期共存,但是隨著移動網際網路及物聯網進入成熟期,數據量暴增會使得海量數據的實時分析壓力越來越大。而隨著固態硬碟及記憶體價格的持續下跌,基於海量並行的MPP記憶體數據倉庫必將成為首選。”劉睿民表示,“柏睿數據目前的客戶都是企業級用戶,他們現有的數據增量已經非常可觀,每天增量TB級的客戶已經越來越多了”,比如在傳統企業裏就有包括中國聯通、諾基亞西門子、萬達資訊等公司;而網際網路行業裏面也有像多米音樂這類企業,他們現在都已經成為柏睿數據的客戶。而且像中國聯通這樣的每天流淌著海量數據的巨無霸公司也開始與柏睿數據合作,現已經有多個系統線上運作,其中包括實時客戶畫像等對數據反映速度要求最苛刻的系統也在使用柏睿數據的RapidsDB。
未來柏睿數據計劃在豐富自己産品線的同時,更多的與生態圈裏的其他國産數據庫友商進行合作,因為作為數據分析及存儲的數據庫是IT基礎架構中至關重要的基石,只有形成良性互動才能建立國産數據庫産業的良好氛圍。
在採訪的最後,劉睿民告先生訴記者,柏睿數據將在國家級的標準方面做更多的工作。他認為數據倉庫的標準是整個行業的標桿,只有設立正確的標桿才能更好的促進國産數據庫的健康發展,企業級産品性能及服務才是根本。柏睿數據,這家坐落在北京的公司,目前擁有一個 20 多人的團隊,研發隊伍主要來自矽谷和本土培養,他們的專業與對市場的精準把握,必然會對海量數據基礎平臺帶來劃時代的革命。