火爆全球的ChatGPT讓大模型技術進入更多人視野,國內大模型廠商的實力能否支撐起類ChatGPT應用?國際權威諮詢機構IDC近日發佈的《2022中國大模型發展白皮書》(以下簡稱《白皮書》),成為一窺國內大模型産業的參考。
作為一個對話式機器人,ChatGPT“上知天文、下知地理”源自大模型的能力支撐,如IDC中國副總裁兼首席分析師武連峰所言,沒有對大模型的長期投入,就不會誕生ChatGPT這樣的應用,而大模型的背後蘊藏著一場人工智慧落地模式的變革。
《白皮書》指出,從技術的角度看,大模型發端于自然語言處理領域,以谷歌的BERT、OpenAI的GPT和百度的文心大模型為代表,參數規模逐步提升至千億、萬億,同時用於訓練的數據量級也顯著提升,帶來了模型能力的提高。
隨著數字化轉型需求增長,AI在企業中的應用越來越多,IDC預測,2026年中國人工智慧軟體及應用市場規模將達到211億美元,人工智慧進入大規模落地應用關鍵期,但是,如何解決已開始顯露的開發門檻高、應用場景複雜多樣、對場景標注數據依賴等問題?AI大模型帶來了新希望。
數據顯示,自2020年起,中國的大模型數量驟增,僅2020年到2021年,中國大模型數量就從2個增至21個,和美國量級同等,大幅領先於其他國家。《白皮書》顯示,百度文心大模型已構建“大模型+工具平臺+産品與社區”三層體系,在能源、金融、航太、製造、傳媒、城市、社科以及影視等領域廣泛應用,打通了大模型産業落地的關鍵路徑。
從《白皮書》提出的行業首個大模型評估框架看,百度旗下文心大模型在市場格局中處於第一梯隊,産品能力、生態能力、應用能力全面領先,受到行業廣泛認可。武連峰説:“在IDC提出的大模型評估框架下,百度文心大模型表現非常突出,這是其打造大語言模型文心一言的堅實基礎。”
據了解,2019年3月百度就已發佈預訓練大模型ERNIE 1.0,2020年開始將文心大模型應用到搜索業務,賦能搜索相關性、深度問答和內容理解等,在中國開發類ChatGPT産品具有先發優勢。
在ChatGPT橫空出世的壓力下,相關企業紛紛表態,而“大模型”無一例外成為關鍵詞,百度短短數行官宣中,用去一段介紹自家的AI四層架構佈局,重點提及文心大模型;谷歌CEO桑達爾·皮查伊表示,自家的AI對話式機器人Bard(吟遊詩人),由大模型LaMDA提供支援。
談及ChatGPT,北京智源人工智慧研究院院長、北京大學電腦學院教授黃鐵軍對科技日報記者説:“自然語言交互跨過了一個坎,為大眾所接受,無論是從人工智慧發展的歷史,還是電腦發展的歷史,都是一個里程碑。技術上,中國做出類似的應用沒有問題,但是,有技術和能做出用戶體驗很好的産品,這之間有很大的差別,它是一個生態構建和服務大量用戶的渠道和運營經驗問題。”
百度創始人、董事長兼首席執行官李彥宏也曾表示,ChatGPT是AI技術發展到一定階段後的新機會,怎麼把這麼酷的技術變成人人需要的好産品,這一步其實才是最難的,也是最偉大、最能産生影響力的。
中國企業能否在類ChatGPT應用中有所作為?首先被拷問的是號稱具有先發優勢的百度,從它近日公佈的名單看,加入百度文心一言生態圈的知名企業名單越來越長。
過去幾年,百度多次公開強調大模型作為AI新型基礎設施的重要作用,呼籲産業關注。《白皮書》指出,以大模型為生態基座的産業鏈將成為智慧化升級中可大規模復用的基礎設施,中國大模型廠商在模型佈局方面較為完善,接下來應進一步圍繞行業賦能的廣度和深度持續探索,不斷夯實基於大模型的産品建設,推動大模型技術從實驗室走向大規模落地。