9月25日,百川智慧發佈Baichuan2-53B 閉源大模型,全面升級了Baichuan1-53B的各項能力。Baichuan2-53B不僅數學和邏輯推理能力提升顯著,還通過高品質數據體系和搜索增強極大降低了模型幻覺。
作為首批通過備案的大模型企業,百川智慧此次還開放了Baichuan2-53B API介面,正式進軍To B領域,開啟商業化進程。
此次開放API後,百川智慧將把行業領先的大模型能力賦能給各行各業的合作夥伴,助力萬千企業智慧化發展。
Baichuan2-53B 是百川智慧發佈的第6款大模型,自4月10日成立以來,該公司以平均每28天推出一個大模型的速度持續創新。
能力全面升級,數學和邏輯推理能力大幅提升
百川智慧于2023年8月8日發佈Baichuan-53B搜索增強大模型,模型在知識問答、文學創作等方面表現優異,展現出商業文案創作(郵件撰寫、公司命名、行銷文案生成)、文學創作(故事續寫、詩詞創作)、中文理解(語義識別、成語含義、詩詞分析)等多種任務場景下的強大能力。
大模型的數學和邏輯推理能力一直是業內的關注焦點,也是評價一款大模型是否領先的重要指標。在Baichuan-53B的基礎上,Baichuan2-53B不僅重點強化了以上兩個維度的能力,並且對整體能力進行了全面升級。其中,邏輯推理能力提升100%,數學能力提升31%,語言理解能力提升29%,文本創作提升18%,知識問答提升9%。
高品質數據體系和搜索增強技術加持,有效降低模型幻覺
幻覺是大模型落地應用必須跨越的鴻溝。通常而言,解決這一問題有兩種方式,一種是不斷增加模型的數據規模、提升數據品質;另一種是通過調用搜索等外部工具讓模型能夠獲取實時資訊。
Baichuan2-53B在兩個方面均做了大量優化。高品質數據構建方面,Baichuan2-53B獨創了一套數據品質體系。以低質、優質為標准將數據進行分類,確保Baichuan-53B始終使用優質數據進行預訓練。
資訊獲取方面,Baichuan2-53B對多個模組進行了升級,包括指令意圖理解、智慧搜索和結果增強等關鍵組件。這一綜合體系通過深入理解用戶指令,精確驅動查詢詞的搜索,最終結合大語言模型技術,優化模型結果生成的可靠性,實現更精確、更智慧的模型回答結果,減少模型幻覺。
在高品質數據體系和搜索增強技術的加持下,Baichuan2-53B有效降低了模型幻覺。百川智慧使用 FacTool 評測後的結果顯示,Baichuan2-53B 的綜合得分為140.5,在主流基礎大模型中僅排在GPT-4之後,處於國內領先水準。
FacTool是由上海交通大學、卡內基梅隆大學、香港城市大學、Meta 等機構學者共同提出的一款通用框架,能夠查核大模型生成內容的事實準確性(也能查核一般性內容的事實準確性)。
開放API, 全面進軍To B領域
除了能力全面升級,Baichuan2-53B 還開放了API介面,企業和開發者可以通過API將Baichuan2-53B整合至他們的應用程式和服務中。Baichuan2-53B融合了最前沿的大模型技術,可以很好的適配不同企業的各種業務需求,無論是智慧客服、智慧寫作還是智慧推薦等各個方面。
Baichuan2-53B的API介面便捷易用,客戶只需要簡單的配置和整合即可接入,同時其對OpenAI的介面高度相容,客戶可以快速遷移,極大降低了模型的部署和轉換成本。
對於企業用戶最關注的安全合規問題,作為首批通過《生成式人工智慧服務管理暫行辦法》備案的大模型企業,百川智慧為Baichuan2-53B打造了覆蓋大模型預訓練、精調、推理全週期的安全增強,能夠為客戶和合作夥伴提供全流程的安全保障。
借助Baichuan2-53B豐富且強大的模型能力,企業用戶不僅可以升級自身已有業務,提高效率、減少成本,還能夠探索更多應用場景,拓展創新的邊界。
未來,百川智慧將持續探索大模型的能力邊界,不斷探索大模型技術的前沿創新,更好地賦能千行百業的智慧化進程。
(責任編輯:李春暉)