李彥宏:中國版ChatGPT背後的AI“布道者”
ChatGPT問世以來,全球為之側目。3月16日,OpenAI發佈ChatGPT最新“升級版本”GPT4模型的第二天,百度創始人、董事長兼首席執行官李彥宏攜同為大語言模型、生成式AI(AIGC)産品“文心一言”亮相發佈會,宣佈開放邀請測試。
“文心一言”一朝出爐,看似倉促,實則包含著李彥宏對AI(人工智慧)的30年情結,以及百度多年來在AI領域的深耕。
“拘謹”的發佈會
發佈會中,李彥宏演示了“文心一言”在文學創作、商業文案創作、數理推算、中文理解、多模態生成5個場景中的應用情況。
李彥宏説,百度在過去的十幾年中,一直在AI的研發上堅持投入,文心大模型的第1個版本在2019年就已發佈,此後每一年都有一個新版本發佈。因此,“文心一言”的發佈,是過去多年努力的自然延續。
關於“文心一言”名稱來歷,百度首席技術官王海峰給出解釋,作為自然語言處理模型,“文心一言”對中國語言文化有著不錯的理解。因此,百度結合南朝文學理論著作《文心雕龍》書名,為産品取名“文心一言”。
“文心一言”是怎樣做出來的?李彥宏解釋,過去,IT的技術棧分為晶片層、作業系統層、應用層或軟體層3層。進入AI時代後,IT技術棧從3層變成晶片層、框架層、模型層、應用層4層,“文心一言”就處在模型層。這幾年,百度著重發展文心大模型,塑造“文心”模型品牌。除了“文心一言”,百度還曾發佈過AI藝術和創意輔助平臺——文心一格。
從此次發佈會呈現的資訊可見,處於框架層的飛漿——産業級深度學習開源開放平臺,支撐了“文心一言”從開發訓練到推理部署。“文心一言”大模型的訓練數據,包括萬億級網頁數據、數十億的搜索數據和圖片數據、百億級的語音日均調用數據,以及5500億事實的知識圖譜等。而飛漿已經凝聚了500多萬名開發者,服務了20萬家企事業單位,創建了67萬個模型。
李彥宏篤信,以後AI時代的應用,都會基於大模型來進行開發。“過去,在服務搜索時,是判別式的語言大模型,‘文心一言’是生成式的語言大模型。生成式AI代表了一種新的技術範式,它會帶來市場需求的爆髮式增長,其商業價值的釋放將是前所未有的、指數級的。”李彥宏説。
作為類ChatGPT産品的“文心一言”,一經發佈,就被網友拿來和ChatGPT比較。相較此前版本,ChatGPT新品GPT-4可以實現強大的識圖能力,文字輸入限制提升至2.5萬字,在回答準確性、文本創作等方面,都有了很大提升。這種變化被比喻為從“小學生”升級到“高中生”。因此,多數觀點認為,文心一言和ChatGPT存在明顯差距。這讓原本害怕工作被AI取代的國內網友調侃道:“提前退休的日子要緩一緩了。”
此次發佈的錄播形式,被“文心一言”關注者詬病。多方聲音也指出,此次發佈有些“趕鴨子上架”,李彥宏在發佈會上表現得“有點拘謹、不自信”。
李彥宏坦承,“我體驗到的(文心一言)也不能叫完美。”“要對標GPT-4,這個門檻還是很高的。”
但同時,李彥宏也表現出了基於自身優勢的自信,“可以説全球的大廠中,百度是第一個發佈(類ChatGPT産品)的。”“全球範圍內在(IT技術棧)4層都有領先産品的公司,可以説絕無僅有。百度就是那個唯一。我們的優勢非常獨特,這個優勢,相信未來大家在文心的迭代速度上會有明顯的感受。”
為何選擇現在發佈?
李彥宏解釋是出於“市場的需求”。他提到,百度的各個産品線,從搜索到智慧雲、到自動駕駛、到小度,都在等著用這樣的技術。“更重要的是我們的客戶,我們的合作夥伴,在等著用這樣的技術。大家都在催我們,需要儘早把它發佈出來。”李彥宏説,“從2月7日百度正式官宣要發佈‘文心一言’以來,一個多月的時間內,已有650多家企業,宣佈接入‘文心一言’的生態。”
“群雄逐鹿”中“彎道超車”
2022年11月底,美國的OpenAI公司推出人工智慧對話聊天機器人ChatGPT。發佈僅5天,ChatGPT用戶就超過100萬人。Facebook當年用了10個月,才達到這樣的成就。這引發了全球AI行業及相關領域的“驚濤駭浪”。
ChatGPT同樣是生成式AI技術産物。何為生成式AI?
近期,《AIGC:智慧創作時代》一書出版。為本書書寫序言的經濟學家、橫琴數鏈數字金融研究院學術與技術委員會主席朱嘉明認為,AIGC是人工智慧經過長期摸索所選擇的重要的、正確的發展方向,他將此次智慧數字化轉型稱為“媲美新石器時代的文明範式轉型”。
北京理工大學網路與安全研究所所長閆懷志向媒體這樣解釋:“生成式AI是指使用機器學習等各種AI演算法,讓人工智慧能夠利用數據進行學習,進而創建或生成全新的原創內容的一種技術。目前,生成式AI能生成文本、圖像、音頻、視頻或代碼等多模態的原創內容。”
生成式AI産品ChatGPT,面對編程、計算、文本創作等繁複工作,只需數秒就能完成,可謂“機”智過人。《財富》雜誌認為,ChatGPT之於AI領域的重大意義,就如同當年的Natscape和iPhone在電腦行業具有的里程碑意義一樣。
冰凍三尺非一日之寒。
20世紀60年代,世界第一款人機對話機器人“Eliza”問世,80年代,IBM推出語音控制打字機“Tangora”,這被認為是生成式AI萌芽階段的産物。2007年,世界上第一部完全由人工智慧創作的小説《1 The Road》問世,2012年,微軟推出語言全自動同聲傳譯系統。20世紀90年代到21世紀的前十年,被認為是生成式AI發展積累階段。
2015年,特斯拉汽車創始人埃隆·馬斯克,格雷格·布羅克曼(OpenAI聯合創始人兼總裁)、山姆·阿爾特曼(OpenAI首席執行官)、彼得泰爾(Paypal創始人)以及伊利亞·蘇特斯科夫(師從神經網路之父傑弗裏·辛頓,OpenAI首席科學家)等數位矽谷大佬拿出了10億美元,創立OpenAI。
OpenAI于2018年發佈第一代大型模型GPT-1,2019年發佈GPT-2,2020年發佈GPT-3。2021年,OpenAI推出生成圖像的人工智慧産品“DALL-E”。
一石激起千層浪。
2022年,全新版本的ChatGPT甫一推出,就猛烈地掀起一股新科技浪潮。一批網際網路科技巨頭,紛紛宣佈加入新一輪的AI“軍備競賽”。
率先入場的谷歌,在今年2月,發佈了人工智慧聊天機器人Bard。但在巴黎首秀中,Bard回答問題時犯下了事實性錯誤,遭遇慘烈“翻車”。這讓谷歌母公司Alphabet股價重挫8.28美元,市值縮水1059.14億美元。
谷歌“翻車”之後,微軟“趁勢而起”,發佈了由OpenAI提供技術支援的新版Bing搜索引擎和Edge瀏覽器。業界認為,微軟此舉,是要撼動谷歌在搜索引擎領域的“壟斷”地位。
國內網際網路大廠不甘落伍。
2月7日,百度官宣“百度版ChatGPT”“文心一言”將於3月份完成內測並對外開放。同日,360公司表示,其在2019、2020年左右就看到了技術變革的可能,並成立人工智慧研究院,投入人力、算力做AI場景,但類ChatGP測試版的推出時間以及實際效果均存在重大不確定性。
2月8日,阿里巴巴技術專家爆料,阿裏達摩院正在研發類ChatGPT對話機器人。同日,京東集團副總裁何曉冬表示,未來,京東會結合ChatGPT,推動人工智慧産業落地。
2月9日,騰訊相關人士稱,騰訊目前也有ChatGPT相似産品和AI生成內容的計劃。
在ChatGPT先聲奪人之後,全球科技大廠站上了同一賽道,並紛紛搶跑,第一個“彎道超車”且斬獲頗豐的正是百度。
有了谷歌新品問世的前車之鑒,百度的“文心一言”發佈,自然顯得異常謹慎、低調。
儘管如此,“文心一言”發佈後,百度集團股價也隨即閃崩,一度跌逾9%。但到了17日,百度集團股價開盤又衝高,這表明部分投資者對“文心一言”重拾信心。而在文心一言官網,等待體驗的用戶,已經排起了百萬人的長隊。
“AI先生”的30年
“群雄逐鹿”的AI競技中,百度的“彎道超車”,絕非偶然。李彥宏將“文心一言”的誕生,總結為“十月懷胎,一朝分娩”。
公開資料顯示,李彥宏個人與AI結緣已有30年。
李彥宏在其編著的圖書《智慧革命》中指出,AI的歷史早于網際網路,與電腦歷史相伴。1956年,達特茅斯會議召開,AI被正式提上日程。那時候一台電腦的體積有一棟房子那麼大,計算能力低下。當時,明斯基已經造出第一台神經網路電腦,不久後寫出了論文《神經網路和腦模型問題》。這篇論文日後成為AI技術的鼻祖。圖靈則在1950年就提出了如今人盡皆知的圖靈測試理論以及機器學習、遺傳演算法、強化學習等多種概念。
圖靈去世兩年後,在達特茅斯會議上,麥卡錫提出AI概念。參與會議的十位年輕科學家,後來成為世界各國人工智慧領域領軍人物。人工智慧迎來短暫春天。
20世紀90年代,AI出現新的研究高潮。此時,李彥宏和AI結緣。
2020年,李彥宏在社交媒體發出一則圖文,其中寫道:“居然翻出了30年前在北大學人工智慧課的筆記。”配圖顯示,在筆電上,李彥宏豎寫著“人工智慧”四個字。那時的李彥宏,在北京大學圖書情報專業就讀。1991年,李彥宏到美國布法羅紐約州立大學入讀電腦係。
留學期間,李彥宏曾選擇人工智慧課程,還發佈了相關論文。但導師告訴他這個行業賺不了錢。
後來,李彥宏在作為美國搜索引擎先驅的Infoseek公司工作,切身感受到了網際網路商戰氣氛,感受到了美國人對新科技浪潮的昂揚熱情。1998年,他據此寫出《矽谷商戰》一書。1999年,李彥宏回國,于北京一家賓館房間創辦百度公司。
2005年,百度在美國納斯達克上市。此後多年,掩映在百度掌門人光環下的李彥宏,迎來另一個身份——“AI先生”。
始於信仰,成于堅持。李彥宏很早就開始了AI佈局。
早在2010年,百度就成為中國最早深度佈局AI的先行企業。
2012年,一位高管向李彥宏演示了深度學習技術對於搜索的改進。李彥宏因此寫了一封郵件,鼓勵全百度産品經理了解AI技術最新趨勢。
2013年1月,百度年會上,李彥宏宣佈深度學習研究院成立,並自任院長。李彥宏認為,“這應該是全球企業界第一家用深度學習來命名的研究院”。
2014年4月,百度成立了大數據實驗室,同年5月又成立矽谷人工智慧實驗。
2017年,百度又增加了商業智慧實驗室、機器人與自動駕駛實驗室……完成了在AI各個細分領域的研究佈局。
2017年7月5日,發生了李彥宏“以身試法”推廣AI技術的一幕:
這一年的百度AI開發者大會上,李彥宏乘坐百度Apollo無人駕駛平臺開發的無人駕駛汽車,從北京五環路駛向會議現場。李彥宏乘坐無人駕駛汽車的視頻流傳網路後,被“老司機”們發現了多項違章。同月11日,李彥宏在山西大學的一場人工智慧專題報告上表示:“當無人駕駛的技術成熟之後,一定比人類司機要更安全。”
在2020世界人工智慧大會上,李彥宏重申,無論當年對網際網路的信仰,還是今天對AI的信仰,自己都沒有一絲絲改變。“我仍然認為,AI是堪比工業革命的技術浪潮,一定會徹底改變今天每一個行業……人工智慧不再遙遠,就在我們身邊,延長了我們的雙手,強大了我們的大腦,豐富了我們的視覺,消除了時空的障礙。”李彥宏説。
AI樂觀主義者
“機器人不得傷害人類個體,或者目睹人類個體將遭受危險而袖手不管;機器人必須服從人給予它的命令,當該命令與第一定律衝突時例外;機器人在不違反第一、第二定律的情況下要盡可能保護自己的生存。”——20世紀中期,世界科幻小説三巨頭之一的阿西莫夫,在其科幻小説中提出“機器人三大法則”。該法則雖在科幻小説中提出,卻是解決“人工智慧恐懼症”的一張“處方”。
但時下,隨著AI技術日新月異,人們對其取代或淘汰,乃至“終結”人類,有著不少擔憂和警惕。相較于警惕、恐慌等負面情緒,李彥宏對AI抱樂觀態度。
2019年,在烏鎮第六屆世界網際網路大會上,針對“人工智慧會毀滅人類”的觀點,李彥宏給出反駁:“人工智慧不僅不會毀滅人類,反而可以讓人們獲得‘永生’ ”。“每一個人説的每一句話,幹的每一件事兒,甚至你的記憶、情感、意識等都可以數字化存儲下來,放在網盤或者其他的雲端,你的思維方式可以被機器學習出來,遇到新問題,通過技術進行現實還原,就可以與後人進行超越時空的對話。”
隨著AI技術的不斷發展,關於人機關係、AI倫理的探討也越來越多。李彥宏也在推動AI倫理方面的研究。他曾在兩會期間接受採訪時表示:“我覺得AI應該做的是讓它去幫助人和服務人,不應該做的是讓它去傷害人和控制人。”他建議,相關部門應該加強人工智慧倫理研究,處理好機器與人的新關係,避免技術“跑偏”。
他樂觀預測,未來20年,人們對手機依賴程度不斷降低。在智慧經濟時代,智慧終端會遠遠超越手機的範圍,人們將會以更自然的方式和機器、工具進行交流。
李彥宏的樂觀,還在於對AI行業的前景展望。
李彥宏回國創業之時,正是網際網路泡沫破裂之際。在許多人出走網際網路領域的形勢下,李彥宏堅持了下來。之後,中國網際網路迎來黃金髮展期,李彥宏和百度迎來了豐厚的市場回報。百度也塑造了國人上網習慣:“有問題,問百度。”
前幾年,AI行業的悲觀情緒也在瀰漫。李彥宏則拿出創立百度之初的情境,鼓勵行業堅定AI發展信心。2022年,李彥宏再次樂觀表示,隨著技術應用門檻不斷降低,創造者們將迎來屬於人工智慧的黃金10年。
此前,他將AI發展分為技術的智慧化、經濟的智慧化、社會的智慧化三個大歷史階段。同時,他將第二階段分為前後兩個階段。李彥宏説,目前,人工智慧正處在經濟智慧化前半段向後半段過渡時期。當到達第三階段,人類終將進入智慧社會。
狂熱的“布道者”
每逢重要場合,李彥宏便化為AI狂熱“布道”。
這從近些年李彥宏的公開發言可見一斑:移動網際網路的機會已經不再有了,新的機會屬於人工智慧,這不是移動網際網路的延續,是一次新的工業革命;我跟以色列總理內塔尼亞胡在會談的時候提出一個觀點,網際網路只是前菜,人工智慧才是主菜;將來“中國製造”要想變得有競爭力、要想真正轉型升級的話,最需要依靠的是人工智慧技術,而不是大數據、雲計算、物聯網……
作為全國政協委員,李彥宏在連續8年的“兩會”中,提出了13份AI相關提案。
有人統計過,在AI大潮襲來的2016年,李彥宏在公開場合提到“人工智慧/AI”500多次。但凡對AI有興趣者,無論是國家領導、相關企業,還是極客、學生,李彥宏都要向他們“安利”AI,不放過任何科普AI的機會。
2019年,另有媒體統計,3年間,李彥宏的40次演講,共計15萬字,都涉及AI,構築起了李彥宏的“AI簡史”。
“布道”之餘,是年復一年的投入。
2020年5月,李彥宏接受採訪時透露,這些年(百度研發投入佔比)基本上都在15%左右。“最近幾個季度,核心研發費用佔百度核心收入比例超20%。”
2022年,百度核心研發費用214.16億元,佔百度核心收入比例達到22.4%。該年四季度,百度研發投入為56.58億元。
目前,百度在AI上投入超10年,研發投入超1000億元。
李彥宏多次説:“即便只有1塊錢 我們也投到技術。”他表示,百度以高科技公司為定位,應該保持這個投入。即便投入不是兩三年就有回報,“但是如果你信這個東西,你就可以七年、十年堅持投下去。”他説。
巨大的投入下,是肉眼可見的産出。
2018年,中國社會科學院社會學研究所發佈的一份報告指出:“百度催生了一個新的社群和勞動力市場。培養了近55萬名人工智慧相關人才,相當於建立了10所專門的人工智慧大學。”
李彥宏在2020年,對於AI設定了具體目標:用5年時間,為全社會培養超過500萬個AI人才。今年1月10日,李彥宏在百度Create AI開發者大會上表示:“目前已培養了超過300萬。”李彥宏的另一個目標則是:到2030年,智慧雲伺服器數量達到500萬台。
這些年,在AI領域,中國一改核心技術落後被動局面,AI專利申請量已超美國。而百度AI專利申請量、授權量、專利品質在中國領先。百度的深度學習專利申請量全球第一。
2022年12月出爐的《中國人工智慧專利技術分析報告(2022)》顯示,百度AI專利申請量16754件,AI專利授權量5705件, AI專利申請和授予量連續五年全國第一,專利品質評測得分92.21,再次位列全國第一。
在《哈佛商業評論》公佈的“2019全球AI公司五強”榜單上,百度位列第四,成為唯一進入全球五強的中國企業。2019年1月,世界智慧財産權組織(WIPO)曾經發佈《WIPOTechnology Trends 2019 ArtificialIntelligence》,百度、中國科學院等嶄露頭角,其中百度是進入全球前30名的唯一中國公司,深度學習專利申請全球排名第二。
百度打造的深度學習平臺飛槳,是中國首個自主研發、功能完備、開源開放的産業級深度學習平臺。與此同時,百度表示,基於AI佈局,它希望成為元宇宙的“基建狂魔”……
“人類的存在就是‘在路上’”
今年2月22日,百度發佈第四季度及全年未經審計財務報告。財報發佈後,李彥宏發出內部信。這成為“文心一言”發佈前的一次總動員。
內部信歷數百度的AI領域“戰果”。例如2022年,百度智慧雲連續四年穩居AI雲服務市場第一;百度完全無人駕駛運營取得了突破,開始在武漢和重慶提供全無人出行服務,並獲准在北京開展全無人駕駛測試……內部信同時提到:“AI技術已經發展到一個臨界點,各行各業都不可避免地被改變”,“百度作為中國人工智慧市場長期增長的最佳代表,正站在浪潮之巔。”
李彥宏説,最近這幾年,他不斷跟團隊講困難、挑戰,為的是當機會來臨時,能夠抓住機會。他號召:“‘用科技讓複雜的世界更簡單’,堅持做正確的事,幫助實現人工智慧的終極理想,‘為人類帶來更多的自由與可能’。”
顯然,發佈“文心一言”,就是李彥宏所説的“抓住機會”。
需要“抓住機會”的不光是李彥宏和百度,還有AI産業和相關創業者。
李彥宏認為,隨著“文心一言”而來的大模型時代,將産生三大産業機會:第一類是新型雲計算公司,第二類是進行行業模型精調的公司,第三類是基於大模型底座進行應用開發的公司,即應用服務提供商。
對於大部分創業者和企業來説,真正的機會是基於通用大語言模型,搶先開發重要的應用服務,而非從頭開始做ChatGPT和文心一言這樣的基礎大模型。李彥宏認為“這很不現實,也不經濟”。“就像移動網際網路時代,最成功的商業産品不見得是安卓和IOS,而是基於安卓和IOS開發的微信、淘寶、抖音等各種超級應用。”李彥宏説。
當地時間3月23日,OpenAI宣佈ChatGPT支援第三方插件接入,這將幫助ChatGPT訪問最新資訊、運作計算或使用第三方服務。同時,OpenAI推出了網路瀏覽器和代碼解釋器兩款自有插件。此外,OpenAI還開源了知識庫檢索插件代碼,使得任何開發者都可以自行託管資訊,從而增強ChatGPT。目前,ChatGPT正在創建自己的生態系統。
李彥宏近日在極客公園的直播中表示,文心一言確實不如現在最好的ChatGPT版本,但差距也不是很大,可能就是一兩個月的差別。文心一言目前差不多是ChatGPT今年1月份的水準。
面對ChatGPT的持續“狂飆”,有觀點認為,文心一言能否在中文領域給予用戶驚喜,甚至在中文領域超越競爭對手,值得期待。“但也不宜期待過高,畢竟文心一言和ChatGPT在算力、演算法、數據上的差異擺在那裏。”此前,浙江大學國際聯合商學院數字經濟與金融創新研究中心聯席主任盤和林向媒體表示。
萬博新經濟研究院院長滕泰也針對“文心一言”發表了自己的觀點。他認為,作為新産品,“文心一言”必然有各種各樣的不完美。但它是仍然是中國人工智慧發展的重要里程碑。
更普遍的觀點則認為,ChatGPT 發佈至今不過4個月,很少有科技公司能在如此有限的時間內,真正做出對標産品,但百度做到了。儘管它不夠完美,但能在科技巨頭的集體焦慮中脫穎而出,這本身就令人鼓舞。“文心一言”的發佈,僅是開端。産品的全貌,以及後續的完善、優化,需要在不斷的使用反饋中進行。
李彥宏主導編著的《智慧革命》一書,在最後一個章節最後一段這樣寫道:“在未來漫長的智慧歲月裏,即便諸如百度、谷歌這樣的人工智慧公司,可能也只是浩瀚歷史中的一個過客……古人説‘不以物喜,不以己悲’‘擔當身前事,何計身後評’,正是我們人類擔當精神的體現。我們能做的就是抓住當下。人類的存在就是‘在路上’。百度要為美麗新世界鋪墊好最初的基因,中國要從大國變成偉大的智慧文明國家,每個人也都應該不甘落後於機器,努力做更好的人,知道更多,做到更多,體驗更多,一起向著美好但不確定的未來進發。”(文/《絲路文明》吳軍禮)
來源:《絲路文明》雜誌 責任編輯:石進玉