11月12日,以“應用來了”為主題的百度世界2024在上海舉辦,百度首席技術官王海峰在會上宣佈了這一數據。除用戶規模外,王海峰還解讀了文心大模型最新技術及應用,如檢索增強的文生圖、無代碼産品秒噠、文心快碼等。
大會現場,繼百度創始人李彥宏宣佈文心大模型日均調用量已超過15億,王海峰公佈了文心一言用戶規模達到4.3億。
自去年3月16日發佈文心一言以來,百度文心大模型不斷升級,知識增強、檢索增強以及智慧體等技術也在不斷進化。
據王海峰介紹,在檢索增強方面,百度研發了“理解-檢索-生成”協同優化的檢索增強技術,提升了大模型技術及應用效果;面向不同應用場景的生圖需求,進一步研發了檢索增強的文生圖技術,既可以生成精確的圖片,也可以進行泛化生圖。
那麼,大模型是如何做到這一點的呢?
首先,基於大模型對用戶的需求進行分析理解,自動規劃精確或泛化方案,比如對哪些實體進行增強;接著在增強階段,對需要增強的實體,檢索並選擇相應的參考圖。最後在生成階段,自研了多模可控生圖大模型,一方面,通過局部注意力計算,在保持實體特徵不變的情況下,實現了圖像的高泛化生成,比如根據牛頓的肖像,生成繪本風格的牛頓;另一方面,通過整體注意力計算,進行高精確的圖像生成,比如生成圖中的汽車跟原圖片保持完全一致。在實際應用中,這個方法也支援用戶上傳參考圖,應用戶期望進行生成。
早在去年10月,百度就發佈了智慧體機制,並研製了系統2。其核心是思考模型,包括理解、規劃、反思和進化,能夠做到可靠執行,自我進化,並在一定程度上將思考過程白盒化,從而讓機器像人一樣思考和行動,自主完成複雜任務,同時在環境中持續學習、自主進化。
人類社會中,一個人掌握的知識和技能終歸是有限的。為了完成更加複雜的任務或項目,需要團隊協作。同樣,智慧體為了完成複雜任務,也需要多智慧體的協作,比如,中心化、去中心化和流水線等模式。多智慧體的協作可以有效增強智慧系統的整體效能,提升解決複雜問題的能力。
王海峰分享了多智慧體在代碼場景裏的應用——秒噠和文心快碼。秒噠採用了智慧體的中心化模式,其中的代碼智慧體通過場景知識的增強,提升了複雜代碼生成的品質與穩定性,高效實現用戶需要的功能。智慧代碼助手文心快碼升級至3.0版本,現場王海峰進一步演示了文心快碼完成系統的功能開發、代碼測試和問題修復等能力。在開發全流程中,多個智慧體流水線協同,大幅提升了程式員的工作品質和效率。
大模型、智慧體等技術發展迅速,而這些技術如何更高效率、更低門檻應用於産業呢?
據了解,面向産業需求,百度打造了文心大模型矩陣,包括ERNIE 4.0 Turbo等旗艦大模型、ERNIE Speed等輕量模型,以及基於基礎模型生産的系列思考模型和場景模型,滿足不同應用的需要。而在這背後,文心大模型和飛槳深度學習平臺聯合優化,持續創新,提升了模型效果、訓練效率和推理性能,支撐了文心大模型的廣泛應用。王海峰現場披露,飛槳文心開發者數量已達1808萬,服務了43萬家企業,創建了101萬個模型。
隨著人工智慧技術加速進步,AI在千行百業的應用也越來越深入。例如,在教育科普領域,中國科學技術館與百度達成戰略合作,雙方將利用人工智慧技術為科普教育注入新活力,賦能智慧科技場館建設。中國科學技術館館長郭哲與王海峰還在現場發佈了“科技館智慧體”,助力科普服務觸手可及;在體育領域,大模型等人工智慧技術輔助國家隊備戰訓練,為運動員奪金爭銀提供科技支撐。智慧跳水輔助訓練系統採用雲、邊、端一體化技術,全自動識別、跟蹤、採集、分析每一個跳水動作。基於文心大模型,系統還可以對動作實時打分、精準量化分析,制定訓練計劃,對運動員身體數據進行科學評估和全面管理。
當下科學技術的發展和廣泛應用,離不開人才。科技是第一生産力,人才是第一資源。現場,百度公佈了人工智慧人才培養的最新數據:已為社會培養了592萬AI人才。
最後,王海峰還篤定地透露,文心大模型仍在持續訓練中,更強大的新版本值得期待。
(責任編輯:張紫祎)