目前市面上的ChatBI通常使用的是NL2SQL的技術路徑,即通過大語言模型直接生成SQL,這種解決方案容易出現數據查詢準確率低(準確率在60%-70%,如果跨表查詢會更低),數據口徑不統一等問題。NL2SQL工具想要落地到真實工程上,需要具備完備 BI能力、極速的交互速度、保證結果的正確性等。
數勢科技SwiftAgent在大模型和AI Agent加持下,通過建立業務指標、人貨場標簽等易於理解的語義層,將自然語言解析到指標和標簽語義(Natural Language to Metrics&Label),即可實現相比ChatBI更精準的數據洞察,解決大模型對底層業務語義難理解的問題。此前,數勢科技推出SwiftAgent 2.0版本,其在1.0版本基礎上做到了五大亮點升級。
亮點一:統一語義層的構建(Unified Data Semantics)
數勢科技SwiftAgent 2.0構建了統一的指標與標簽語義層,即Natural Language to Metrics+Label to SQL,實現兩段式數據洞察。第一段解決大模型對底層業務語義難理解和幻覺的問題,建立行業標準、指標、人貨場標簽等易於理解的語義層;第二段解決企業各部門數據口徑統一的問題,有效避免數據臟亂差等現象,將傳統的經驗決策升級為以數據為核心的智慧決策。ChatBI通常使用NL2SQL(自然語言到SQL)技術容易出現數據查詢準確率低(準確率在60%-70%,如果跨表查詢會更低),數據口徑不統一等問題。
亮點二:用戶可干預(Human in the Loop)
數勢科技SwiftAgent 2.0可通過更自然的方式引導用戶,如當用戶提出“我想看一下最近的銷售情況。”這種模糊的數據查詢,SwiftAgent會給出“最近7天銷售額”、“本月北京地區銷售額”等選項,供用戶選擇,用戶還可以根據提示重新提問,最終得到他真正想要看的分析內容。
此外,SwiftAgent 2.0還可以通過用戶“點讚”和“踩”的反饋進行強化學習,不斷糾正錯誤、調整查詢,從而更懂用戶所想所需,也讓分析更準確,ChatBI無法了解和正確引導用戶的問答方式。
亮點三:持續反思學習(Continued Reflection Learning)
SwiftAgent2.0可將所有使用用戶過往的問答分析沉澱到知識庫,加上上文提到的強化學習結果,在之後其他用戶相似的問詢場景中,直接提供結論並提供思考過程。這種不斷反思學習的能力,也發揮了大模型最大的特點。隨著時間的推移不斷進步,SwiftAgent2.0可以變得更加聰明、好用,並更貼近業務需求。
亮點四:多源數據連結(Diverse Data Connection)
SwiftAgent2.0還實現了多源異構的數據接入,不僅能接數倉,還能導入文本、Excel、圖片、音視頻等非結構化知識,滿足全面分析思路。如:“美國數據反映勞工市場有降溫跡象,減息預期加強,推動金價上漲,導致黃金ETF産品持倉量持續升高。”
亮點五:數據計算加速引擎 (Hyper Computing Acceleration)
SwiftAgent2.0採用了數勢科技獨創的數據計算加速引擎,可以實現秒級數據查詢,真正實現實時的人機交互。
1)底層選用了StarRocks、Doris等數據分析引擎作為執行引擎,在大寬表查詢、跨模型關聯查詢和物化視圖等方面性能更好;
2)結合對數據加工和使用場景進行了一系列優化,提供基於視圖的預計算能力和基於預計算結果的查詢優化能力;
3)數據虛擬化技術,將數據定義和物理數據(業務)解耦,實現指標/標簽靈活加工使用,無需排期開發;
總之,當下ChatBI的解決方式無法解決口徑混亂問題,數勢科技SwiftAgent在大模型和AI Agent加持下,通過建立業務指標、人貨場標簽等易於理解的語義層,將自然語言解析到指標和標簽語義(Natural Language to Metrics&Label),可以幫助企業管理層及個人更高效準確的獲取數據、分析數據,助力科學決策的落地與實施。