中國網3月1日訊(記者 謝露瑩)近期,由美國人工智慧公司OpenAI推出的大語言模型ChatGPT所取得的技術突破引起學術界和産業界的廣泛關注。

人工智慧大模型技術為何能實現突破?其所依賴的“創新模式”是什麼?日前,全國政協委員、360集團創始人周鴻祎在他的提案中對此進行解讀。周鴻祎認為,要關注技術創新,同時更要關注技術突破背後所依賴的創新模式。面對ChatGPT為代表的人工智慧大模型技術的巨大躍升,中國理應迎頭趕上,奮起直追。

ChatGPT的關鍵成功因素有哪些?

周鴻祎認為,ChatGPT的成功因素有“微軟+OpenAI”的産研協同模式發揮了巨大作用,是大型企業+科研機構協同創新的典範,更是開源、合作和眾包模式的典範。

周鴻祎介紹,ChatGPT的成功是大型企業+科研機構協同創新的典範。美國等科技創新企業在協同中充分發揮了大型科技企業的優勢。如對模型工程化調優的支援;大規模算力支援;訓練數據的抓取;幫助改善用戶體驗;提供用戶流量的支援;收集用戶反饋提升強化學習效果;商業化模式的探索;基於瀏覽器、搜索引擎探索用戶使用場景;巨大且持續的投資支援等。

“在這樣全方位的支援下,OpenAI可以專注于學術研究,在技術路線上堅持長期主義,不斷吸引尖端人才,持續打磨演算法和模型,不斷向前推進技術邊界。這樣優勢互補的方式支撐了ChatGPT的技術創新。”周鴻祎説。

ChatGPT的成功更是開源、合作和眾包的典範。周鴻祎提出以下幾點理由:

“沒有開源就不會有ChatGPT的誕生。”周鴻祎表示,ChatGPT本身就是基於開源演算法不斷完善的結果,初代GPT建立在谷歌公司開源的Transformer演算法之上,吸收了業界大量開源成果,並且GPT1、GPT2都已經開源。同時,ChatGPT所使用的訓練數據大部分是開源數據集,包括Common Crawl、WebText2、維基百科、書籍、期刊、開源代碼等數據,比重超過90%。

另外,開源也促進産業的共同發展,而不是少數公司壟斷技術。通過開放論文、開源代碼,微軟、谷歌、臉書等,大型公司及眾多創新型中小公司齊頭並進,不斷推進技術進步。

還有,ChatGPT的訓練和調優應用了大規模的眾包模式,不僅外包了人工標注和人工排序的工程性工作,還通過開放介面,在供全球用戶使用的同時,也收集了海量的真實提問以及點讚或者負向反饋,使模型不斷調優。

周鴻祎表示,ChatGPT是以通用大模型為中心的生態創新模式,這也是其成功不可或缺的因素。他介紹,ChatGPT是一個通用的大語言模型,只有開發出各種各樣的垂類應用才能連接百行千業,服務於傳統産業的數字化、智慧化轉型。OpenAI在應用創新上“不搞一家通吃”,而是把ChatGPT通用大模型作為一個作業系統或應用商店,面向創業者和創新型中小企業開放,扶持上百家中小公司孵化各行各業的垂直應用,使各行各業無需再“大煉大模型”,從而專注于開發行業領域的智慧化應用。目前,引用ChatGPT開放介面的應用已多達上千個,各類問答、代碼生成、內容創作等新應用如雨後春筍不斷涌現,促使産業生態快速發展。

中國應如何突破瓶頸,迎頭趕上?

面對人工智慧大模型技術的巨大躍升,中國應如何做?對此,周鴻祎建議,中國也要建立大型科技企業+重點科研機構的産研協同創新模式,打造中國的“微軟+Open AI”組合引領大模型技術攻關。

他認為,中國可以從建設國家戰略科技力量高度出發,篩選技術基礎好的産研機構,組成優勢互補的産業協同組合,發揮科研機構在關鍵核心技術上的研究優勢,同時發揮大型科技企業在産品化、工程化、場景化、商業化和數據化方面的優勢,成為大模型技術攻關和應用的龍頭。

另外,中國還需支援設立多個國家級人工智慧大模型的長期開源項目,打造開源眾包的開放創新生態。

周鴻祎認為,人工智慧大模型不應成為少數公司壟斷的高級技術,而應最大發揮其對於産業和社會的價值。他建議,針對多條技術路線以開源模式設立多個國家級長期項目,以大型科技企業+重點科研機構為龍頭,通過開源、合作、眾包和生態的創新模式,引導高校、科研機構和創新型企業形成多個技術路線的創新生態群。

(責編:唐佳蕾 張艷玲)