> 指數

文心大模型4.0首發 AI“生成未來”

“我們即將進入一個AI原生的時代!”在首鋼冰球館的工業文化的魅力與人工智慧的科幻感交相呼應下,百度創始人、董事長兼首席執行官李彥宏在百度世界大會2023舞臺上開啟了一場以AI原生應用為主題的演講,並宣佈文心大模型4.0正式發佈。從趕超同行到齊頭並進,從勉力研發到繁榮生態,AI大模型在我國正掀起了一場從技術創新到商業、工業等各行各業變革的浪潮。

文心4.0四大能力全面提升

“文心大模型4.0實現了基礎模型的全面升級,在理解、生成、邏輯和記憶能力上都有著明顯提升,綜合水準與GPT-4相比毫不遜色。”一開場,李彥宏就為大眾帶來了令人振奮的消息,我國自主研發的AI大模型綜合能力已比肩國際頂尖大模型。

基於文心大模型4.0,李彥宏依次演示了四大能力的特點與應用場景。在理解能力上,他通過詢問住房公積金異地貸款政策的案例,展示了文心一言對前後亂序、模糊意圖、潛臺詞等複雜提示詞的理解力,例如文心一言能夠在這一場景中將“在北京工作”的通俗表達等同於“在北京繳納公積金”這一潛臺詞等。

在生成能力上,李彥宏展示了文心一言如何在短短幾分鐘內,根據一張素材圖片,迅速生成了一組廣告海報、五條廣告文案以及一條行銷視頻。據介紹,基於這一系列能力,百度已經推出了AIGC行銷創意平臺擎舵,讓“一個人就成為一支AI行銷隊伍”。

同時,他還通過解數學題、總結知識點等場景,展示了大模型的邏輯能力;通過數千字的小説撰寫和角色、情節設置,體現了大模型的記憶能力;以及醫生數字人幫助患者解讀藥品説明書,來展現四大能力的綜合應用。

“理解和生成能力的提升幅度相近,而邏輯和記憶能力的提升則更大,邏輯的提升幅度達到理解的近3倍,記憶的提升幅度也達到了理解的2倍多。”百度首席技術官王海峰説。

星河計劃再育500萬大模型人才

在李彥宏現場亮出新版大模型四大能力的同時,王海峰對文心一言的基礎模型,即文心大模型4.0背後的關鍵技術和最新進展進行了解讀。據悉,文心大模型4.0在9月已開始小流量上線,過去一個多月效果又提升了近30%。8月31日文心一言面向全社會開放至今,用戶規模已經達到4500萬,開發者5.4萬,場景4300個,應用825個,插件超過500個。百度基於文心大模型研製了智慧代碼助手Comate,從內部應用效果來看,整體的代碼採納率達到40%,高頻用戶的代碼採納率達到60%。

據悉,此前文心一言的基礎模型在5月升級至文心大模型3.5,在基礎模型升級、精調技術創新、知識點增強、邏輯推理增強、插件機制等方面創新突破,取得效果和效率的提升。

王海峰介紹,文心大模型4.0基本技術架構與3.0和3.5版本一脈相承,並在多個關鍵技術方向上進一步創新突破。例如,在萬卡算力上運作飛槳平臺,通過集群基礎設施和調度系統、飛槳框架的軟硬協同優化,支援了大模型的穩定高效訓練。建設了多維數據體系,形成了數據挖掘、分析、合成、標注、評估閉環,充分釋放數據價值,大幅提升模型效果。基於有監督精調、偏好學習、強化學習等技術進行多階段對齊,保障模型更好地與人類的判斷和選擇對齊。可再生訓練技術通過增量式的參數調優,有效節省了訓練資源和時間,加快了模型迭代速度。

此外,文心大模型4.0在輸入和輸出階段都進行知識點增強。一方面,對用戶輸入的問題進行理解,並拆解出回答問題所需的知識點,然後在搜索引擎、知識圖譜、數據庫中搜尋準確知識,最後把這些找到的知識組裝進Prompt送入大模型,準確率好,效率也高;另一方面,對大模型的輸出進行反思,從生成結果中拆解出知識點,然後再利用搜索引擎、知識圖譜、數據庫,以及大模型本身進行確認,進而對有差錯的點進行修正。

為滿足源源不斷的大模型技術創新和産業應用需求,王海峰在現場發佈了百度人才培養星河計劃。“我們將與産學研各界密切合作,深化産教融合,為社會再培養500萬大模型人才,讓人工智慧科技的‘創新之花’,結出更多‘産業之果’,服務國家戰略,服務社會發展,服務人民福祉。”王海峰説。數據顯示,百度在2020年提出5年為全社會培養500萬AI人才,截至目前其已培養了420萬AI人才。

AI原生“生成未來”

人工智慧大模型能夠釋放各行各業源源不絕的新生産力,這無疑是這輪席捲全球的技術浪潮未來更重要的流向。如何才能抓住這背後蘊藏的巨大機遇?百度的答案是——AI原生應用。

所謂AI原生應用,就是基於大模型的理解、生成、邏輯和記憶能力開發出來的應用。李彥宏認為,這些能力是過去所不具備的,因而能夠打開無限的創新空間。李彥宏在以《手把手教你做AI原生應用》為主題的演講中發佈了新搜索、新地圖等十餘款AI原生應用。

搜索業務是百度早年間起家時的核心産品。如今,百度搜索也已經基於AI大模型完成重構。李彥宏介紹,百度新搜索具有極致滿足、推薦激發和多輪交互三個特點,當用戶搜索問題時,新搜索將“不再是給你一堆連結”,而是通過對內容的理解,生成文字、圖片、動態圖表的多模態答案,讓用戶一步獲取答案。在針對複雜需求時,“多輪交互”特點也可以通過提示、調整等方式,滿足用戶更個性化的搜索需求。

會上,國內首個生成式商業智慧産品百度GBI發佈,它可以把商業分析師十幾天才能完成的數據分析、撰寫報告的工作,縮短到分鐘級。通過AI重構的智慧辦公平臺新如流,則可以實現1000條群聊消息一秒劃重點等功能,成為辦公人士的智慧助理,讓“智慧工作”代替“勤奮工作”。

通過對海量文檔、圖片和視頻的理解和再生成,百度網盤和文庫擁有了創作能力:網盤不僅能精準定位到視頻某一幀,還能在幾秒鐘內總結完長達1小時的視頻內容,並從中提煉出金句和要點;文庫則可基於10億優質資料實現寫稿和做PPT等工作,成為“生産力工具”。

正如李彥宏此前所説,AI原生應用不是對移動網際網路App和PC軟體的簡單重復,而是要能“解決過去解決不了或解決不好的問題”。

“大量AI原生應用將不斷涌現,數字技術與實體經濟將深度融合……大模型正成為新型工業化的重要推動力。”李彥宏説。正如百度世界大會2023的主題是“生成未來”,在演講結尾,李彥宏表示,我們即將進入一個AI原生的時代,進入一個人機通過Prompt來交互的時代。據悉,自10月17日起,企業用戶可登錄百度智慧雲官網,在千帆大模型平臺上申請測試文心大模型4.0的API介面。(記者 孫奇茹)

來源:北京日報  責任編輯:劉松

(原標題:文心大模型4.0首發 AI“生成未來”)