2024年10月22日,以“前沿發明,引領AI産業新變革”為主題的“2024百度十大科技前沿發明”發佈會在北京召開。在今年的十大前沿發明中,大模型已成為産業創新和解鎖新質生産力的重要抓手,AI原生應用正在融入生産生活的方方面面。
百度首席技術官(CTO)王海峰表示,前沿發明不僅支援百度提升了自有産品、業務效果和效能,也為百度産品AI原生化重構,為人工智慧賦能千行百業貢獻了力量。百度發佈十大發明,一方面,通過表彰這些引領産業創新的前沿成果,鼓勵更多的創新創造;另一方面,推動産業界更多應用這些成果,加快産業化進程。早在2017年,百度就開始探索和研究大模型技術,並進一步突破基於思考模型的智慧體技術,拓展了大模型的能力邊界,促進大模型應用爆發。
北京市智慧財産權局副局長潘新勝指出,近年來,國家高度重視人工智慧産業發展,北京市正在大力推動人工智慧創新策源地和産業高地建設。市智慧財産權局大力支援以百度公司為代表的産業智慧財産權龍頭企業,在重點領域開展産業智慧財産權促進中心建設,以智慧財産權為紐帶帶動重點産業強鏈增效。作為人工智慧領域領先企業,百度創新技術和智慧財産權工作已經走在了全國的前列。希望百度以此次發佈會為契機,繼續加強科技創新,以人工智慧技術加快賦能産業高品質發展。
現如今,人工智慧與實體經濟加速融合,我國完備的産業體系為人工智慧技術提供了廣闊應用舞臺,推動産業轉型升級,成為科技革命和産業變革的關鍵力量。2024年兩會提出“人工智慧+”戰略,強調AI在數字經濟中的重要性,加快實現高水準科技自立自強。百度作為領先科技企業,積極推進技術規模化落地,加強自主創新,在城市、交通、工業、金融等領域取得顯著成果,為科技強國和産業強國目標貢獻力量。AI産業正處奇點,技術紅利將釋放,技術發展也將為各行業轉型注入新動力。
百度集團專利事務部總經理崔玲玲發佈“2024百度十大科技前沿發明”。她表示,百度人工智慧領域的前沿專利發明,涵蓋了從基礎演算法到應用場景的全方位突破,正引領著AI産業新的變革,希望不斷加速專利技術的産業化進程,以此推動千行萬業的智慧化升級,從而促進經濟高品質和可持續的發展。
自2013年入局AI領域,百度一直堅持壓強式、馬拉松式的研發投入,近十年累計研發投入近1700億元。據國家工業資訊安全發展研究中心、工信部電子智慧財産權中心今年4月份發佈的《新一代人工智慧專利技術分析報告》顯示,截至2023年底,百度在人工智慧全領域專利申請量19308件、授權量9260件,連續六年位居國內第一;在以大模型為核心的新一代AI領域,百度專利申請1432件、授權651件,成為技術創新和專利佈局領軍者。
附:
百度2024十大科技前沿發明:
一、基於生成式大模型的智慧體技術
該發明技術創新性地引入了思考模型,使智慧體具備了任務規劃、工具調用、知識增強和反思進化等多重能力。通過系統化的設計與核心能力的定向優化,能夠低成本地支援不同應用場景下智慧體的規模化建設與部署;通過建設大規模倣真能力,加速智慧體構建與分發。該技術系統已成功應用於文心智慧體平臺、商家智慧體、文心快碼等多個重點場景,顯著提升了智慧體的研發效率,降低了研發門檻。其中,商家智慧體通過規劃+專家的多模型協同技術和大規模倣真技術,提升反思、進化和使用工具的能力,構建AI行銷能力;文心快碼依託代碼推薦和智慧體系統,與傳統DevOps工具鏈有機結合,推動人機協同結對編程的深度探索與落地。
二、基於大模型高效訓練框架的多模型協同進化技術
該發明技術從工程和演算法兩個角度攻克系列難題。工程架構上,從混合併行策略、通信效率、計算存儲優化全方位創新突破,顯著提升大語言模型訓練性能,支撐文心全系列模型全流程高效穩定訓練。演算法策略上,研發了大小模型協同的預訓練技術,攻克了模型間知識難以繼承的技術難題,改變了傳統模型的訓練範式,降低了新模型訓練成本。基於該發明構建了各規模模型的技術壁壘,使文心大模型訓練吞吐速度在過去一年提升了4.1倍,支援文心一言高效滿足不同需求的廣泛業務,賦能千行萬業。
三、基於大模型和知識檢索增強技術的多模態內容創編一體的智慧系統
本發明技術綜合運用知識增強、多源內容解析、融合式編輯、檢索增強文生圖等技術,解決了專業長文及多模態內容生成品質弱、創編無法共用容器、文生圖主體準確性差等問題。檢索增強文生圖,旨在通過智慧判斷用戶需求自適應處理參考圖,進而基於混合模態的生圖系統顯著提升了生圖主體的一致性,有效彌補長尾內容刻畫不準確的短板,整體效果遠遠超過文生圖原生系統。百度文庫已經在基於用戶指令及上傳內容實時生成行業研報、演示文稿、思維導圖、畫本漫畫並支援一站式編輯、跨模態轉換、通用/個性化生圖等複雜任務方面取得了顯著的效果提升。2024年8月,極光旗下月狐數據發佈報告顯示,百度文庫智慧PPT市場份額已達八成,近3月用戶規模複合增速達23%,增速遠超行業水準。
四、支援規模化的自動駕駛定位和車道級地圖生成技術
該發明技術突破了傳統模式的效率和成本問題,降低了地圖製圖成本95%,車道級道路里程超過360萬公里,實現全國超過41000個城鄉鎮道路的全覆蓋。基於地圖數據進一步構建的多模態感測器融合的自動駕駛高精定位技術,精度達到釐米級,極大提高了可量産性,將車端定位依賴的地圖包體積降低97.5%,可靠性達到99.9999%,全面支撐目前蘿蔔快跑全無人駕駛的規模化運營,在高架橋下、多層路、隧道等各種複雜困難場景實現全無人駕駛。
五、面向大模型智慧化的個性化記憶機制
該發明技術創新性地提出了一套全面的記憶機制,涵蓋記憶加工、存儲、管理、觸發和利用五大模組,賦予大模型個性化記憶能力。記憶加工借鑒人類海馬體機制,實現了對全場景用戶資訊的深度理解和精準加工;記憶管理支援用戶主動與系統自動的增刪改查,確保了記憶庫的實時更新與準確;記憶觸發和利用,通過相關記憶的推測生成,輔助大模型産生更加擬人和個性化的回復。該發明技術已廣泛應用於智慧AI助手、數字人等場景。
六、基於大模型的超擬真數字人建模、驅動與生成系統
該發明技術提出了一整套的超擬真數字人建模、驅動和生成方案。針對真人數字人,研發了數據驅動的人像建模、跨模態驅動和人像視頻生成大模型,實現了自然、擬真的數字人內容生産,獨家支援大幅動作&遮擋場景的直播人像克隆,並實現了首個全身智慧驅動直播間落地。針對超寫實3D數字人,基於文心大模型研發了模態遷移和多智慧體協作技術,實現了分鐘級製作媲美影視大片、3A遊戲的超寫實數字人形象及運營內容。本發明技術已廣泛地應用於數字人直播、視頻生産、智慧體等眾多真人和3D數字人的産品中。
七、基於大模型的生成式商業檢索系統
該發明技術變革了傳統的“索引-召回-排序”流程,扁平化系統漏斗,減少資訊損失,通過構建索引學習任務,將商業資訊編碼進模型參數,實現“模型即索引”,利用大模型的理解和推理能力,實現“生成即檢索”,新範式顯著提升系統定向效率120%。該發明所涉及項目業界率先落地,實現大規模工業化應用,生成式大模型結合商業搜索場景取得多項技術創新,創意豐富度提升37倍,創意品質提升92%,獲得了顯著的業務收益和廣泛技術影響力。
八、大模型數據飛輪技術
該發明技術通過整合用戶反饋、執行反饋和自監督反饋等多來源和形式的資訊,自動識別模型缺陷並高效合成高品質、多樣化的訓練數據。同時結合多源反饋的強化學習方法,顯著提升了模型訓練效果。該創新技術構建了一個能夠持續自我改進的數據飛輪,有效突破了大模型的數據瓶頸,降低了數據獲取成本,提高了大模型的適應性和魯棒性,提升了模型在不同任務場景下的泛化能力,加速大模型持續進化。
九、大模型高效推理技術
該發明技術提出的高效推理技術,底層模型層基於飛槳框架,在推理架構方向,結合主流的PrefixCaching、Lookahead、PagedAttention、PD分離等方向持續創新,並將各項技術高效結合,大幅提升模型吞吐和性能。在大模型壓縮方面,採用大模型無損量化技術,通過激活自適應分段平滑與權重聯動重排等方法,在業內率先實現了對百億千億級大模型的高效無損壓縮。該發明支援多種大模型壓縮和推理加速手段,目前已應用於百度智慧雲千帆大模型平臺等核心業務,減少模型推理的資源消耗,節省大模型部署成本超50%,提升模型性能,模型吞吐提升3-5倍。
十、用戶數據反饋驅動的檢索生成系統
該發明技術提出的檢索生成系統,能夠結合用戶行為反饋信號,實現快速自我強化。通過滿意度建模和強化學習直接對齊用戶偏好,並利用用戶反饋觸發系統快速反思,解決了傳統數據應用時專家反饋效率低和用戶偏好建模難的問題。基於該框架的檢索生成系統已覆蓋18%的搜索流量,廣泛應用於文字、視頻、圖片等搜索場景。多元用戶反饋的規模大、可迴圈的特性,使系統能夠快速適應數據、産品和環境的變化,幫助系統自動化尋優,加速系統向理想狀態演進,具備極高的實用價值和市場競爭力。
(責任編輯:沈曄)