極狐銷量翻倍增長,北汽藍谷勢能向上 | 低空經濟起航,萬勳獵戶座無人機柔韌臂開啟空中複合作業新格局 | 深耕文檔型數據庫12載,SequoiaDB再開源 | 技術基因&自主創新,光鑒科技塑造3D視覺感知新範式 | 入駐企知道科創空間,沃新智創“泵”發新動能 | CRO公司想要更好更快輸出實驗報告,就用魔方網表 | Doctor's Best多特倍斯牽手伊能靜 傳遞家庭營養健康科學理念 | 突破極限,瞰世山野!探路者2024春夏新品發佈 | 溫書豪參與《對話》錄製 妙論晶泰“廣積糧、高築墻、緩稱王” | 寫《繁花》的金宇澄,也愛刷短視頻 |
 
當前位置: 新聞>滾動>

深耕文檔型數據庫12載,SequoiaDB再開源

發佈時間:2024-01-16 13:34:27  |  來源:中華網  |  作者:  |  責任編輯:科學頻道

1月15日,巨杉數據庫舉行SequoiaDB新特性及開源項目發佈活動。本次活動回顧了巨杉數據庫深耕JSON文檔型數據庫12年的發展歷程與技術演進,全面解讀了SequoiaDB包括在高可用、安全、實時、易用性四個方向的技術特性,宣佈了2024年面向技術社區的開源計劃。此次發佈活動不僅是對SequoiaDB性能的全面介紹,更是對十餘年來始終堅守以JSON文檔型數據庫內核為技術底座的發展歷程的深刻回顧。不忘來時路,方知向何行,巨杉數據庫也將在2024年新年伊始,迎來新的篇章,開啟新的征程!

穩健發展,行業影響力不斷提升

回顧過去,巨杉數據庫自2011年研發內核、2012年公司成立,至2013年推出SequoiaDB v1.0版本,再到如今已走過十二個春秋。歷經12年的洗禮,巨杉數據庫也取得了令人矚目的成就。目前,巨杉數據庫已經在超過100家大型銀行及金融機構的核心生産業務規模應用,覆蓋各行業的企業用戶總數超過1000家。在金融行業,其客戶群體涵蓋國有銀行、股份制銀行、省級農信、城商行、保險、證券等金融機構,同時還積極擴展政府、汽車、新能源等多個行業客戶,贏得了廣泛的市場認可。其中超過50家企業的應用時間已超過6年,最長的系統運作時間甚至達9年。自成立以來,公司實現穩健發展,行業影響力不斷提升,數據量及業務接入保持持續增長態勢。

守正創新,發展JSON文檔型內核

巨杉數據庫SequoiaDB以 JSON文檔型數據庫內核為技術底座,通過分佈式架構為眾多客戶提供了多元化的業務和全方位的支援。正是因為對技術創新的堅持以及對市場需求的洞察,巨杉數據庫始終堅守JSON文檔型內核,在持續迭代中實現創新發展。

在JSON基礎能力方面,從最初 v1版本,實現 CURD原子性的操作以及基礎的ACID支援,到 v2版本逐步提升對LOB大對象的存儲能力,標誌著巨杉數據庫具備“多模數據”處理能力,同時支援存儲過程、聚集計算等特性。在 v3.0版本中,進一步提供自增序列全文檢索、基於時間點的數據恢復和相容部分 Mongo語法。跨越4.0版本,到v5.0版本,SequoiaDB著力提升穩定性能,對於統計資訊、訪問計劃、存儲等進行了大量優化,提供死鎖檢測等功能,並進一步地相容 Mongo 3、 Mongo 4的語法。

在分佈式管理方面,從基礎的多分區原生分佈式架構,逐步提供讀寫分離、主子錶、策略訪問、多中心容災、精細化容災等特性,持續增強分佈式能力。

在安全性方面,涵蓋從基礎的鑒權、加密到信創的各類能力。此外,推出了SCM內容管理引擎,專注于非結構化數據和多模數據處理的統一數據生命週期管理。

在易用性方面,通過SAC運營的管理平臺,全面提升DBA運維的便捷性。

十二年來,巨杉數據庫基於JSON文檔型數據底座和分佈式架構的不斷更新與迭代,為企業提供可靠的數據處理和存儲解決方案,幫助企業優化業務效率,提升客戶滿意度。

廣泛拓展,基於文檔型技術的應用場景

在中國乃至全球範圍內,“CM場景”是文檔型技術應用中重要且突出的場景。基於處理多變的數據結構和龐大的數據量的迫切需求,催生了“CM內容管理平臺”,同時極大地推動了SequoiaDB技術的創新。巨杉數據庫持續跟進客戶需求,進行技術迭代,實現從1.0到 5.0的跨越式發展。巨杉數據庫為金融銀行客戶提供,穩定、可靠、可持續擴展的「CM內容平臺」成為「銀行影像平臺」及「非結構化管理平臺」的數據基礎設施,目前已吸納超過100家客戶使用該場景。可以説,基於文檔型技術並應用於“CM內容管理平臺”場景是巨杉數據庫取得的最為顯著的成果之一,這一場景也持續為巨杉數據庫貢獻了超過85%的客戶及營收,成為業務的主打業務場景。

此外,文檔型數據庫在線上業務系統、實時數據湖、IoT領域以及AGI人工智慧等領域也得到廣泛應用。JSON靈活的格式適合各種線上業務系統,尤其是面向需要快速迭代開發的各類APP的業務應用,基於文檔型數據庫的開發,可以顯著提升團隊的研發效率。在實時數據湖方面,巨杉數據庫借助JSON靈活的數據處理能力,已助力多家客戶構建全量歷史數據平臺,支援跨系統、跨業務的實時高併發數據查詢。

Vector Search基於文檔型技術,探索AGI數據應用新邊界

AGI通用人工智慧的發展,將進一步推動JSON文檔型數據類型的應用(實際上,本次發佈活動中,Vector Searche部分的講解也是通過AI技術合成的)。

傳統AI應用中,需要存取及處理的是,海量的半結構化「 CM內容管理」數據、「動態標簽」數據,以及各類非結構化對象數據。這些都正是 SequoiaDB過去12年聚焦及取得顯著成果的領域技術,而 AGI全新的爆發性發展,必將對 JSON文檔型技術,帶來全新的機遇及技術挑戰。當前,業界領先的 Open AI、文心一言等大模型平台中,JSON已經被指定為對內,及對外,函數調用的,標準數據傳輸格式。

另外,我們可以看到“向量數據”在 AGI通用人工智慧發展中,得到了關鍵的應用,需要更有效的數據庫處理能力。

向量數據的存放格式,天然就可以用 JSON結構表示,非常適合通過文檔型數據庫處理。然而,單獨使用向量數據,並不能解決業務的全景問題。在業務過程中,向量數據還必須與其他業務數據進行組合使用,才能發揮其價值。因此 SequoiaDB也正在探索,為文檔型數據庫提供 「Vector Search向量搜索」能力,為保存到 SequoiaDB的向量數據,提供高效的查詢能力,這一特性將在2024年與大家見面。

要注意的是,我們並不需要發展獨立的向量數據庫産品。而是基於深耕了12年的 JSON文檔型數據庫底座技術為基礎,進行向量查詢能力的擴展,這將可以幫助企業,驅動實體世界的更多數據,和 AGI通用人工智慧進行有效連結,釋放全量數據價值。

四大特性,釋放全量數據價值

巨杉數據庫基於JSON文檔型底座對SequoiaDB進行了全面升級,此次發佈活動全面解讀了SequoiaDB的四大特性——高可用、安全、實時和易用。

高可用:文檔型數據庫處理的數據,包括了結構化的元數據、半結構化的標簽數據,以及非結構化的對象數據。對於PB級大數據或上百節點規模的大集群,在面對重大災難時的數據可靠性、數據一致性和系統可用性時都面臨著巨大挑戰。精細化容災能有效地幫助客戶實現針對這些數據的多中心容災,從而提升整體系統的高可用和數據高可靠能力。

安全:巨杉數據庫不僅在技術上通過國密演算法和硬體加速來平衡安全與性能,還提供了跨國內外不同晶片、不同作業系統的混合部署能力。這意味著巨杉數據庫可以實現集群的異構部署,平滑地進行硬體資源的替換,對上層業務系統做到完全透明,保障業務連續性。

實時:巨杉數據庫憑藉JSON文檔型數據結構的Schema靈活性,為企業提供了全量數據底座。DDL的實時變更、橫向擴展能力,以及高性能的併發點查能力等都顛覆了傳統ODS數據貼源層的界限,使得ODS能夠服務於實時業務,滿足對客實時數據查詢和企業內部跨業務數據實時匯總的需求。

易用:巨杉數據庫進一步增強了SAC的監控、告警和管理等功能。一站式的數據管理工具,極大地方便了DBA的管理工作,提高了問題排查的效率並簡化了對系統的監控管理,從而為業務帶來更高的穩定性和效率。

開放、開源共赴新篇章

新年伊始,巨杉數據庫也將譜寫嶄新篇章。發佈會介紹,巨杉數據庫決定將在2024年Q1再次發佈開源版本,不僅希望獲得社區同仁的參與和監督,讓産品未來發展更透明;同時也承擔歷史責任,希望通過開源的方式吸引更多合作夥伴,共同發展中國的分佈式文檔型數據庫生態鏈,促進業務的快速迭代和開發效率的提升。近期,SequoiaDB新版本的源代碼將通過Gitee、GitCode及GitHub再次開源。