十方融海率先開發出全球第一個免費使用開源可商業化中文大語言模型

發佈時間:2023-07-03 17:46:26 | 來源:中國網 | 作者:辛文 | 責任編輯:趙茜

在人工智慧領域,大語言模型正以前所未有的速度發展,已經成為眾多企業、研究機構和個人開發者的新寵。十方融海作為以數字科技創新為展新引擎的數字職業線上教育科技企業,也將AI大語言模型作為公司科研創新主要發力方向之一,技術團隊一直刻苦鑽研,致力於提供開放、免費獲取、公開下載、可離線部署的,具備真正認知能力和頓悟能力的大語言模型,並在多語言模型訓練方面積攢了豐富的經驗。

近日,十方融海集團旗下威科軟體聯合OpenBuddy團隊宣佈:領先業界推出了國內首個基於Falcon架構、可商用的中文跨語言模型——OpenBuddy-Falcon-7B。這也是全球第一個可免費使用開源的中文大語言模型,適用於大多數商業應用場景需求,且家用顯示卡也能輕鬆運作,為個人和企業提供更便捷、更全面的大語言模型智慧化應用。

今年 5月,Tii研究機構發佈了 Falcon模型,使用 Apache 2.0的可商用開源協議,Falcon模型不僅在協議和數據集方面更加開放,還採用了最新的 Flash Attention等技術,展現出了驚人的性能和內容品質。Falcon模型一經發佈,便榮登 Huggingface Open LLM Leaderboard的首位,成為最新的 SOTA開源大語言模型。

十方融海在Falcon模型推出之初,便對其産生了濃厚的興趣。十方融海技術團隊深知,現有的 SOTA開源語言模型,包括 LLaMA和 Falcon,都存在“跨語言支援能力薄弱”這一問題。這些模型主要以英語、法語等印歐語系為基礎,並且缺乏跨語言對話場景的深度優化。因此,它們在理解中文等非印歐語系語言方面存在困難,更無法進行有意義的對話。

對此,為了給個人和企業提供更便捷、更全面的大語言模型智慧化應用,經過不懈的研究和試錯,十方融海旗下威科軟體聯合OpenBuddy團隊成功地掌握了 Falcon模型的訓練訣竅,推出了全球首個基於 Falcon架構、開放可商用的中文跨語言大模型——OpenBuddy-Falcon-7B。

相較于原始Falcon模型,OpenBuddy-Falcon-7B在跨語言能力方面更具優勢,支援包括中文、日語、韓語、英語、法語、德語等多種語言。

通過採用新穎的跨語言學習技術與深度優化對話場景,大幅提高了模型對跨語言知識的理解能力和融合能力,模型可以實現在各種語言之間進行自由、流暢的對話,並能在多種語言直接切換,完成翻譯等需要跨語言能力的任務。

此外,模型具備插件使用能力,能分析用戶的意圖,自動選取並調用插件。例如,調用Stable Diffusion開源模型畫圖,調用內置的搜索引擎搜索資料等等;模型更是能夠深度理解用戶的需求,可以完成問答、寫作、模倣、創作等多種任務,還可以完成“畫一個車水馬龍的街道”,“畫一個醜小鴨長大後變成的動物”等複雜指令。

這並非十方融海首次推出中文大語言模型。事實上,十方融海技術團隊已經在多語言模型訓練方面積累了豐富的經驗,早在falcon模型推出之前,十方融海聯合OpenBuddy團隊就曾在 LLaMA的 7B、13B、30B模型上進行了反覆迭代和調優,研發出了OpenBuddy-LLaMA系列開源模型。這些模型在中文、日語、韓語等多種語言上具備優秀的問題理解和回答能力,可以利用英文論文、代碼等資料學習到的知識,為中文問題提供專業的回答和見解。

作為跨語言模型,OpenBuddy-LLaMA系列在中文、日語、韓語等多種語言上具備優秀的問題理解和回答能力,也吸引了全世界眾多開放模型愛好者的關注,llama.cpp、Langport、FastChat等開源項目均實現了OpenBuddy-LLaMA系列模型的整合,並在社區中獲得了廣泛的應用。

十方融海技術團隊負責人表示,OpenBuddy-Falcon-7B的發佈,標誌著一個嶄新的時代的到來。在這個時代裏,跨語言的大模型不再是科技巨頭的專利,而是開放、可商用的資源,能為全球的開發者、企業和研究者提供強大的支援。相信 OpenBuddy-Falcon-7B的發佈,將對跨語言 AI領域的發展産生深遠的影響,未來也有望見證更多基於 OpenBuddy-Falcon-7B的創新應用和突破性技術問世,共同推動人工智慧領域的繁榮發展。

值得一提的是,目前除了 7B(70億)參數的模型以外,OpenBuddy團隊還在訓練以13B(130億)、40B(400億)為訓練參數的OpenBuddy-LLaMA-13B、OpenBuddy-Falcon-40B等百億規模的大語言模型。

在十方融海董事長黃冠的帶領下,十方技術團隊在AI大語言模型上將持續取得創新和突破,在更好滿足大眾平等使用AI技術需求的同時,也讓十方在新的AI大浪潮下走在前列。未來,十方將始終保持求是創新、擁抱變化的態度,為社會、為用戶創造出更大的價值。