文心大模型4.0首發 AI“生成未來”

指數發表于：2023-10-18 10:24

“我們即將進入一個AI原生的時代！”在首鋼冰球館的工業文化的魅力與人工智慧的科幻感交相呼應下，百度創始人、董事長兼首席執行官李彥宏在百度世界大會2023舞臺上開啟了一場以AI原生應用為主題的演講，並宣佈文心大模型4.0正式發佈。從趕超同行到齊頭並進，從勉力研發到繁榮生態，AI大模型在我國正掀起了一場從技術創新到商業、工業等各行各業變革的浪潮。

文心4.0四大能力全面提升

“文心大模型4.0實現了基礎模型的全面升級，在理解、生成、邏輯和記憶能力上都有著明顯提升，綜合水準與GPT-4相比毫不遜色。”一開場，李彥宏就為大眾帶來了令人振奮的消息，我國自主研發的AI大模型綜合能力已比肩國際頂尖大模型。

基於文心大模型4.0，李彥宏依次演示了四大能力的特點與應用場景。在理解能力上，他通過詢問住房公積金異地貸款政策的案例，展示了文心一言對前後亂序、模糊意圖、潛臺詞等複雜提示詞的理解力，例如文心一言能夠在這一場景中將“在北京工作”的通俗表達等同於“在北京繳納公積金”這一潛臺詞等。

在生成能力上，李彥宏展示了文心一言如何在短短幾分鐘內，根據一張素材圖片，迅速生成了一組廣告海報、五條廣告文案以及一條行銷視頻。據介紹，基於這一系列能力，百度已經推出了AIGC行銷創意平臺擎舵，讓“一個人就成為一支AI行銷隊伍”。

同時，他還通過解數學題、總結知識點等場景，展示了大模型的邏輯能力；通過數千字的小説撰寫和角色、情節設置，體現了大模型的記憶能力；以及醫生數字人幫助患者解讀藥品説明書，來展現四大能力的綜合應用。

“理解和生成能力的提升幅度相近，而邏輯和記憶能力的提升則更大，邏輯的提升幅度達到理解的近3倍，記憶的提升幅度也達到了理解的2倍多。”百度首席技術官王海峰説。

星河計劃再育500萬大模型人才

在李彥宏現場亮出新版大模型四大能力的同時，王海峰對文心一言的基礎模型，即文心大模型4.0背後的關鍵技術和最新進展進行了解讀。據悉，文心大模型4.0在9月已開始小流量上線，過去一個多月效果又提升了近30%。8月31日文心一言面向全社會開放至今，用戶規模已經達到4500萬，開發者5.4萬，場景4300個，應用825個，插件超過500個。百度基於文心大模型研製了智慧代碼助手Comate，從內部應用效果來看，整體的代碼採納率達到40%，高頻用戶的代碼採納率達到60%。

據悉，此前文心一言的基礎模型在5月升級至文心大模型3.5，在基礎模型升級、精調技術創新、知識點增強、邏輯推理增強、插件機制等方面創新突破，取得效果和效率的提升。

王海峰介紹，文心大模型4.0基本技術架構與3.0和3.5版本一脈相承，並在多個關鍵技術方向上進一步創新突破。例如，在萬卡算力上運作飛槳平臺，通過集群基礎設施和調度系統、飛槳框架的軟硬協同優化，支援了大模型的穩定高效訓練。建設了多維數據體系，形成了數據挖掘、分析、合成、標注、評估閉環，充分釋放數據價值，大幅提升模型效果。基於有監督精調、偏好學習、強化學習等技術進行多階段對齊，保障模型更好地與人類的判斷和選擇對齊。可再生訓練技術通過增量式的參數調優，有效節省了訓練資源和時間，加快了模型迭代速度。

此外，文心大模型4.0在輸入和輸出階段都進行知識點增強。一方面，對用戶輸入的問題進行理解，並拆解出回答問題所需的知識點，然後在搜索引擎、知識圖譜、數據庫中搜尋準確知識，最後把這些找到的知識組裝進Prompt送入大模型，準確率好，效率也高；另一方面，對大模型的輸出進行反思，從生成結果中拆解出知識點，然後再利用搜索引擎、知識圖譜、數據庫，以及大模型本身進行確認，進而對有差錯的點進行修正。

為滿足源源不斷的大模型技術創新和産業應用需求，王海峰在現場發佈了百度人才培養星河計劃。“我們將與産學研各界密切合作，深化産教融合，為社會再培養500萬大模型人才，讓人工智慧科技的‘創新之花’，結出更多‘産業之果’，服務國家戰略，服務社會發展，服務人民福祉。”王海峰説。數據顯示，百度在2020年提出5年為全社會培養500萬AI人才，截至目前其已培養了420萬AI人才。

AI原生“生成未來”

人工智慧大模型能夠釋放各行各業源源不絕的新生産力，這無疑是這輪席捲全球的技術浪潮未來更重要的流向。如何才能抓住這背後蘊藏的巨大機遇？百度的答案是——AI原生應用。

所謂AI原生應用，就是基於大模型的理解、生成、邏輯和記憶能力開發出來的應用。李彥宏認為，這些能力是過去所不具備的，因而能夠打開無限的創新空間。李彥宏在以《手把手教你做AI原生應用》為主題的演講中發佈了新搜索、新地圖等十餘款AI原生應用。

搜索業務是百度早年間起家時的核心産品。如今，百度搜索也已經基於AI大模型完成重構。李彥宏介紹，百度新搜索具有極致滿足、推薦激發和多輪交互三個特點，當用戶搜索問題時，新搜索將“不再是給你一堆連結”，而是通過對內容的理解，生成文字、圖片、動態圖表的多模態答案，讓用戶一步獲取答案。在針對複雜需求時，“多輪交互”特點也可以通過提示、調整等方式，滿足用戶更個性化的搜索需求。

會上，國內首個生成式商業智慧産品百度GBI發佈，它可以把商業分析師十幾天才能完成的數據分析、撰寫報告的工作，縮短到分鐘級。通過AI重構的智慧辦公平臺新如流，則可以實現1000條群聊消息一秒劃重點等功能，成為辦公人士的智慧助理，讓“智慧工作”代替“勤奮工作”。

通過對海量文檔、圖片和視頻的理解和再生成，百度網盤和文庫擁有了創作能力：網盤不僅能精準定位到視頻某一幀，還能在幾秒鐘內總結完長達1小時的視頻內容，並從中提煉出金句和要點；文庫則可基於10億優質資料實現寫稿和做PPT等工作，成為“生産力工具”。

正如李彥宏此前所説，AI原生應用不是對移動網際網路App和PC軟體的簡單重復，而是要能“解決過去解決不了或解決不好的問題”。

“大量AI原生應用將不斷涌現，數字技術與實體經濟將深度融合……大模型正成為新型工業化的重要推動力。”李彥宏説。正如百度世界大會2023的主題是“生成未來”，在演講結尾，李彥宏表示，我們即將進入一個AI原生的時代，進入一個人機通過Prompt來交互的時代。據悉，自10月17日起，企業用戶可登錄百度智慧雲官網，在千帆大模型平臺上申請測試文心大模型4.0的API介面。（記者孫奇茹）

來源：北京日報責任編輯：劉松

(原標題：文心大模型4.0首發 AI“生成未來”)