美國公司OpenAI推出的人工智慧聊天機器人ChatGPT“火”出圈了,上線兩個月就收穫了1億月活用戶,成為歷史上增長最快的消費級應用程式。這個速度打破了此前由字節跳動旗下短視頻社交平臺TikTok創造的9個月收穫過億月活用戶的紀錄。
這款“現象級”産品背後預示著什麼樣的未來?中國有開發類似産品的基礎嗎?
競爭已至
在社交平臺展示自己與ChatGPT的對話截圖,已經成為一種時尚。它可以用自然語言和人類用戶對話,理解用戶意圖,完成寫論文、寫代碼等各種內容生成任務;還可以展現“學霸”光環,在沃頓商學院通過了MBA考試、在明尼蘇達大學通過了法學院考試……
“ChatGPT是人工智慧領域的又一次革新,將會推動新一輪的AI(人工智慧)模型競爭。”遠鑒資訊技術有限公司首席技術官鄭榕認為,ChatGPT的最大貢獻在於基本實現了理想型語言預訓練模型的介面層,讓機器人學習適應人類的表達方式,而不是反過來讓人類學習可以命令機器的指令,這是一種更符合人類表達習慣的人機介面技術。
ChatGPT的火爆對産業界、學術界都帶來了巨大的衝擊。
“2016年以來,我國人工智慧産業規模呈現迅猛增長態勢,但2019年我國人工智慧投融資出現大幅度下跌。”賽迪顧問股份有限公司副總裁宋宇認為,總體來看,人工智慧發展退潮主要還是缺乏支撐産業快速發展的技術突破,而ChatGPT的出現恰好給行業發展和投資帶來了新動力。
高科技投資機構方舟投資發佈報告預測,到2030年,AI將大幅提高知識工作者的工作效率,平均工作效率增加140%。“新一代人工智慧技術將有可能大幅度降低腦力勞動者的工作強度。如果這一切成為現實,或將是繼人類歷史上由於動力革命而擺脫繁重的體力勞動之後,人類社會發生的又一次深刻的技術革命。”阿裏研究院資深技術專家、中國電腦學會人工智慧專委會常務委員蘇中在近日發佈的文章中表示。
“ChatGPT更偏向於對話機制的巨大優勢,對包括谷歌在內的傳統搜索引擎而言是巨大的挑戰。它的火爆將大大推動OpenAI主導的大規模語言模型研究方向的發展。隨著企業多模態領域的佈局,人工智慧相關領域會有突破性的進展。”北京航空航太大學人工智慧研究院副研究員胡堃説,由於ChatGPT對算力要求較高,對於計算資源有限的高校而言,加大了學術研究的困難,亟需打通企業資源,加強産學研合作。
抓緊佈局
在ChatGPT帶來的這波AI競爭中,中國顯然不甘人後。2月13日北京市經濟和資訊化局發佈的《2022年北京人工智慧産業發展白皮書》中,明確提出支援頭部企業打造對標ChatGPT的大模型,著力構建開源框架和通用大模型的應用生態。
從預訓練到大模型的AI技術突破,是ChatGPT獲得成功的基礎。傳統的AI模型訓練中,標注成本一直是阻礙AI演算法推向更大數據集合的障礙;而預訓練技術不依賴數據標注,就可以訓練出一個大規模深度學習模型。2020年6月,OpenAI發佈了大型語言模型GPT—3,參數規模達到1750億,ChatGPT正是基於該模型的改進版而創建的。
大模型展現出的能力、潛力和豐富的應用場景,早已激發很多企業和研究機構投身這場競賽。2021年1月,谷歌大腦推出了1.6萬億參數規模超級模型。2020年11月,華為啟動了中文預訓練大模型項目,2021年4月,千億參數規模的盤古大模型發佈。2021年6月,由北京智源人工智慧研究院牽頭,多家機構參與共同研發的悟道2.0大模型,參數規模達到1.75萬億。阿里巴巴達摩院在2020年初啟動中文多模態預訓練模型M6項目,2021年10月,M6的參數規模擴展到10萬億,成為當時全球最大的AI預訓練模型。
蘇中認為,在這條數據、演算法和算力三輪同時驅動的技術賽道上,中美兩國技術團隊已經形成了“兩駕馬車”的發展模式,不斷刷新人工智慧能力規模上的邊界線。在AIGC(人工智慧內容生成技術)高品質論文領域,中國和美國數量幾乎持平,並大幅度領先其他國家。
“人工智慧可以成為我國自主創新的突破口。我國人工智慧産業與美國相比雖有一定差距,但差距並不大。”宋宇説,比如面對大模型所需要的日趨龐大的算力需求,國內已建立多個超算中心,以及專門的人工智慧算力中心。“整體上看,我國現在的算力已經領先了人工智慧的需求,為自主創新提供了保障。”
數據顯示,近年來,我國人工智慧産業增速高於全球水準。2017年至2021年,我國人工智慧産業規模增長了2.6倍,佔全球比重提升到16.8%。2012年至2022年9月,全球人工智慧領域發表的論文約100萬篇,其中28%的論文來自中國。中國高水準論文産出佔比從2012年的20.36%增長到2021年的50.71%。專利數量上,全球人工智慧專利累計授權量25萬件,中國佔比60%。
迎接挑戰
ChatGPT已領先一步,中國企業能否趕超?
“ChatGPT從回答的邏輯性和完整度上都遠超國內大模型,在回復速度上,ChatGPT也領先一截。”鄭榕認為,這種差距與數據品質有一定關係。AI的進化需要投餵大量數據,而全球網際網路的中文數據品質,相比于英文數據品質還有明顯差距。“我們要想辦法,做好中英文不同語言之間的數據互補。”鄭榕説。
ChatGPT使用的大模型對計算資源消耗極大,這意味著需要大筆投資。2019年,微軟向OpenAI投資10億美元,2021年另一輪投資數額未公開。今年1月,微軟宣佈將向OpenAI開展“多年、數十億美元”的投資,兩家公司沒有披露具體款項,但據美國媒體透露,微軟將向OpenAI投資100億美元。
面對這樣的門檻,胡堃建議通過政策發力整合資源。“大多數企業無法承受人工智慧發展對於算力等資源的巨大消耗,建議國家從政策層面整合相關資源,如建立統一的計算平臺,結束各企業計算資源割裂和重復建設的狀態,促成各方達成某種協議,共同建設,共獲收益。”胡堃説。
另一方面,門檻也是改進和趕超的機會。ChatGPT需要大量算力和能源投入,成本很高,大規模商用必須改進技術、降低成本。比如AI晶片不但需要保證高性能,還要做到高算力下低功耗,對此,國內晶片廠商可以有所作為。平臺型科技企業也可以發揮綜合優勢,與研究機構、高校等合作形成聯合創新主體,加速新一代AI技術的産品轉化。
“在體制機制上,要對開展自主創新的企業有足夠的耐心。”宋宇表示,在國家層面,建議進一步完善對人才和機構的考核機制,要有長遠的目標和足夠的耐心讓企業自主創新,要有試錯容錯機制。
以ChatGPT為代表的人工智慧內容生成技術,目前也面臨許多倫理問題和安全問題,如歧視、詐騙、抄襲、造謠、偽造身份等,需要在發展中加以規範。
多位專家表示,由於ChatGPT在中美科技競爭中扮演極其重要的角色,建議對相關技術和應用領域,採取鼓勵創新、包容審慎的監管原則。同時,加強行業指引,特別是在科研、生活服務、商業、消費等倫理與安全相對有保障的應用領域,要積極鼓勵發展。
期待在ChatGPT引爆的新一輪AI産業競爭中,中國企業可以大展宏圖。