第三屆北京智源大會開幕,全球最大智慧模型“悟道2.0”重磅發佈

發佈時間:2021-06-01 | 來源:中國網 | 作者: | 責任編輯:白玥

image.png

6月1日,由北京智源人工智慧研究院(以下簡稱智源研究院)主辦的2021北京智源大會在北京中關村國家自主創新示範區會議中心成功開幕

北京智源大會是智源研究院主辦的年度國際性人工智慧高端學術交流活動,定位於AI內行頂級盛會2019年舉辦了首屆大會,今年為第三屆,6月1日至3日線上線下同步召開,超過3萬名人工智慧領域專業人士註冊參會。

image.png

大會開幕式上,北京市副市長靳偉、科技部戰略規劃司司長出席並致辭。靳偉副市長在致辭中指出,近年來,北京市大力推動人工智慧的加速發展,在前沿研究、人才發展、應用示範、資金支援等方面出臺了一系列有力舉措,加快建設首個國家新一代人工智慧創新發展試驗區,持續推動智源研究院等新型研發機構發展。目前已擁有人工智慧相關企業1500余家,擁有人工智慧學者超過四千人,産業人才超過四萬人,論文的發表和專利的申請量均居全國第一,形成了人工智慧人才、成果、企業集聚的強磁場。

image.png

(北京市副市長靳偉)

 

靳偉副市長同時指出,當前,超大規模的預訓練模型成為全球人工智慧技術研發的熱點和競爭的焦點,有望引領未來五至十年的技術躍遷,並帶來全新的産業模式為了迎接大模型+大算力時代的到來,北京市支援智源研究院牽頭建設超大規模人工智慧模型訓練平臺,打造悟道系列模型希望國內外的廣大高校、科研機構和創新企業積極參與到大模型研發和應用生態中,基於該平臺不斷産出具有國際領先水準的標誌性技術和應用成果。

科技部戰略規劃司司長在致辭中指出,為貫徹落實中央關於人工智慧發展的部署要求,目前科技部正在加快推進新一代人工智慧規劃有關任務落實,實施重大項目,支援北京等15個地方建設國家新一代人工智慧創新發展試驗區,依託領軍企業建設自動駕駛、智慧供應鏈、圖像感知等15個國家新一代人工智慧開放創新平臺,加快人工智慧在疫情防控中的廣泛應用,推動人工智慧治理,發佈實施新一代人工智慧治理原則,建設包括政策法規、倫理規範、技術標準等在內的人工智慧治理體系。

image.png

(科技部戰略規劃司司長倞)

司長同時指出,當前科技部正在全力支援北京市建設國際科技創新中心,與北京市共同實施支援北京加快建設具有全球影響力的人工智慧創新策源地行動計劃,希望北京市在加強原創性科技攻關、強化戰略科技力量、塑造良好創新生態激發人才創新活力推進開放合作等方面持續發力,加強能力和生態構建,構築人工智慧等重點領域技術的優勢,在國際科技創新中心建設方面走出一條新路子。同時希望智源研究院加大超大規模智慧模型的持續研發及産業生態建設,早日建成我國人工智慧研發應用的重要基礎設施。

在大會開幕式上,智源研究院發佈了全球最大的超大規模智慧模型悟道2.0。在為期三天的會議中,智源研究院還將發佈支援AI創業的源創計劃,以及為海內外青年AI科研人員提供學術交流平臺的“青源會”等工作計劃或建設成果。

一、200余位AI頂尖專家,29專題論壇,打造最綜合、最前沿AI盛會

本次大會邀請到200余位國內外人工智慧領域的頂尖專家參會,包括2018圖靈獎得主Yoshua Bengio(約書亞·本吉奧)2017圖靈獎得主David Patterson(大衛·帕特森)2017年歐洲大腦獎得主Peter Dayan(彼得·達揚),清華大學國家金融研究院院長朱民博士,北京大學鄂維南院士,加州大學伯克利分校人工智慧統計中心創始人Stuart Russell(斯圖爾特·羅素),自動駕駛之父Sebastian Thrun(塞巴斯蒂安·特龍)計算可持續性領域開創者Carla Gomes(卡拉·戈梅斯)艾倫人工智慧研究所AI2)首席執行官Oren Etzioni(歐倫·艾佐奧尼),微軟亞洲研究院副院長劉鐵岩,清華智慧産業研究院首席科學家馬維英等。參會專家將圍繞人工智慧領域的前沿研究進展及趨勢開展深入研討。

 image.png

2018年圖靈獎得主Yoshua Bengio

 

大會圍繞國際人工智慧學術前沿和産業熱點設置了“預訓練模型”“機器學習”“群體智慧”“人工智慧的數理基礎”“智慧體系架構與晶片”“精準智慧”“智慧資訊檢索與挖掘”“青源學術年會”“AI創業”“AI制藥”“AI系統”“AI開放與共用”“AI科技女性”等29個專題論壇。議題範圍非常豐富,從AI基礎研究、跨界融合到産業應用,給學者、工程師、技術人員提供了一個交換和活躍想法的平臺。

6月1日的開幕式上,圖靈獎得主Yoshua Bengio、清華大學國家金融研究院院長朱民博士,北京大學鄂維南院士分別圍繞邏輯分析系統System2、數據資産、科學與智慧做主旨報告。

image.png

(清華大學國家金融研究院院長朱民博士)


 image.png

 (北京大學鄂維南院士)

二、發佈全球最大的超大規模智慧模型“悟道2.0”,打造我國人工智慧戰略基礎設施

構建自主技術創新體系,打造大模型時代的智力源

開幕式上,智源研究院理事長張宏江介紹了“悟道”模型研發的背景。他認為,目前,“大模型+大算力是邁向通用人工智慧的一條可行路徑。大模型對於人工智慧發展具有重大意義,未來將基於大模型形成類似電網的變革性AI産業基礎設施。AI大模型相當於發電廠,將數據,也就是燃料,轉換為智慧能力,驅動各種AI應用。如果將大模型和所有的AI應用相連接,為用戶提供統一的智慧能力,全社會形成一個智慧能力生産和使用的網路,即智網大模型就是下一個AI的基礎平臺,是未來AI發展的戰略基礎設施

 image.png

(智源研究院理事長張宏江)

目前,國際主流的大模型主要基於英文語料研發,智源研究院作為AI基礎建設的先行者,成立了由智源研究院學術副院長唐傑教授領銜,100多位科研骨幹共同參與的悟道團隊,啟動面向中文的大規模智慧模型研發工作。悟道模型系統將構建大模型、大平臺、大生態持續研發超大規模智慧模型圍繞大模型研發,構建大規模算力平臺,同時對外開放模型能力,“賦智”各行業發展,構建大模型生態。今年3月20日,智源研究院發佈了中國首個超大規模智慧模型悟道1.0,訓練出中文、多模態、認知、蛋白質預測等系列模型。經過不到3個月的持續更新迭代,悟道2.0實現了更高層面的跨越。

開幕式上,智源研究院學術副院長唐傑教授介紹了“悟道2.0”模型的具體情況。他提到,“悟道超大模型智慧模型旨在打造數據和知識雙輪驅動的認知智慧,讓機器能夠像人一樣思考,實現超越圖靈測試的機器認知能力。“悟道”團隊在大規模預訓練模型研發上做了很多基礎性工作,形成了自主的超大規模智慧模型技術創新體系擁有從預訓練理論技術到預訓練工具,再到預訓練模型構建和最終模型測評的完整鏈條,從技術上是完整成熟的通過一系列原始創新和技術突破,本次發佈的悟道2.0實現了“大而聰明”,具備大規模、高精度、高效率的特點。

 image.png

(智源研究院學術副院長唐傑)

 

全球最大萬億參數,新一代FastMoE補齊萬億模型最後一塊短板

“悟道2.0”模型的參數規模達到1.75萬億,是GPT-310倍,打破了之前由Google Switch Transformer預訓練模型創造的1.6萬億參數記錄,是目前中國首個全球最大萬億模型

 image.png

開創性的研發FastMoE技術,是打破國外技術瓶頸,實現“萬億模型”基石的關鍵。以往,由於Google萬億模型的核技術MoE(Mixture of Experts)與其分佈式訓練框架和其定制硬體強綁定絕大多數人無法得到使用與研究的機會。“悟道”團隊研究並開源的FastMoE首個支援PyTorch框架的MoE系統,具有簡單易用、靈活、高性能等特點,並且支援大規模並行訓練。新一代FastMoE,支援SwitchGShard等複雜均衡策略,支援不同專家不同模型,萬億模型實現方案補上了最後塊短板,讓夢想終成現實。

“悟道2.0”模型在中英雙語共4.9T的高品質大規模清洗數據上進行的訓練。訓練數據包含WuDaoCorpora中1.2TB中文文本數據2.5TB中文圖文數據,以及Pile數據集的1.2TB英文文本數據

另外,“悟道2.0”模型一統文本與視覺兩大陣地,支撐更多任務,更加通用化。

9項頂尖智慧能力,創新性的通用精準智慧

“悟道2.0”在世界公認的9項Benchmark基準測試任務上取得優異成績,達到了精準智慧。

1) ImageNet zero-shot SOTA在200類超過OpenAI CLIP;

2) LAMA知識探測:超過AutoPrompt;

3) LAMBADA完形填空:能力超過1.7倍參數微軟Turing NLG;

4) SuperGLUE few-shot FewGLUE:超越GPT-3,取得當前最佳少樣本學習結果;

5) UC Merced Land-Use zero-shot SOTA,超過OpenAI CLIP;

6) MS COCO文生成圖:超越OpenAI的DALL·E;

7) MS COCO英文圖文檢索:超過 OpenAI CLIP 和 Google ALIGN;

8) MS COCO多語言圖文檢索:超過目前最好的多語言多模態預訓練模型UC2,M3P;

9) Multi 30K多語言圖文檢索:超過目前最好的多語言多模態預訓練模型UC2,M3P。

 image.png

“悟道2.0”的高精度來自於一系列核心技術創新。例如:

GLM2.0:是模型架構創新的典範,更通用的預訓練模型。此前,它首次打破BERTGPT壁壘,開創性地以單一模型相容所有主流架構,新一代版本更是以少勝多的高性能人工智慧典範,以100億參數量,足以匹敵微軟170億參數的Turing-NLG模型,取得多項任務的更優成績。

P-tuning2.0演算法:極大拉近少樣本學習和全監督學習的差距,少樣本學習能力遙遙領先。

CogView文本生成圖像的新框架,克服“上下溢收斂”文圖模型關鍵難題,VQ-VAE和Transformer進行結合,表現SOTA當前演算法性能最優的模型!在MS COCO FID指標上性能優於DALL·E等模型。模型可直接實現類似OpenAI CLIP模型的自評分功能,生成國畫、油畫、卡通畫、輪廓畫等多元畫風。

 目前,“悟道”模型的多項應用,在詩詞創作、做對聯、文本摘要、人設問答、繪畫等方面,都已接近突破圖靈測試,與人類一較高下!

高效易用,全鏈路的效率提升,增強大規模智慧模型産業普適性

大規模預訓練模型的參數規模通常遠超傳統的專用人工智慧模型,在算力資源、訓練時間等方面消耗巨大。為了提升大規模預訓練模型的産業普適性和易用性,悟道團隊搭建高效預訓練框架,在高效編碼、高效模型、高效訓練、高效微調和高效推理等方面進行全鏈路的原創突破或迭代優化,實現效率的大幅提升。

高效編碼:研發了最高效、最抗噪的中文預訓練語言模型編碼,解決生僻字等問題;

高效模型:構建了世界首個純非歐空間模型,只需要一半的參數量即可達到近似歐式模型的效果;

高效訓練:世界首創大規模預訓練模型融合框架,形成高效訓練新模式,訓練時間縮短27.3%,速度提升37.5%

高效微調:世界首創多類別Prompt微調,只需訓練0.001%參數即可實現下游任務適配;

高效推理:世界首創低資源大模型推理系統,單機單卡GPU即可以進行千億參數規模的模型推理。

行業貢獻,建設全球最大的語料數據庫WuDaoCorpora2.0提出自然語言評測新標準智源指數

“悟道”模型研發過程中,智源研究院建設了全球最大的語料數據庫WuDaoCorpora2.0,包含全球最大的中文文本數據集全球最大的多模態數據集、全球最大的對話數據集,為行業內大規模智慧模型的研發提供了豐富的數據支撐

另外,智源研究院提出“智源指數”,構建以人類語言能力為參照、全面系統的針對機器語言能力進行評測的體系。“智源指數”首次提出了基於“能力-任務-數據集”層次結構的機器語言評測體系及評測方案,包含6種主要語言能力,30余項主流任務與相關數據集,同時也是首次基於信度、難度、效度等指標進行評價的高品質評測數據集合,形成了大模型權威考卷

三、“悟道”模型生態合作機構簽約,基於超大規模智慧模型的産業生態建設加速

智源研究院推動開展“悟道”超大規模智慧模型産業生態建設,將面向個人開發者、中小創新企業、行業應用企業、IT領軍企業等不同主體,分別提供模型開源、API調用、“專業版”大模型開發、大模型開發許可授權等多種形態的模型能力服務,賦能AI技術研發。

本次大會開幕式上,智源研究院與新華社、美團、小米、快手、搜狗、360、寒武紀、第四範式、好未來、智譜華章等22“悟道”大模型産業生態戰略合作企業進行了簽約,簽約企業涵蓋行業應用企業、IT龍頭企業、中小創新企業等。同時發出組建“悟道”大模型技術創新生態聯盟的倡議,吸引更多企業加入,將以聯盟為樞紐,以企業需求為導向推動模型研發,共同開發基於“悟道”大模型的智慧應用,以模型研發和應用促進産業集聚

image.png

另外,智源研究院還啟動了“悟道之巔”模型應用大賽,鼓勵各類創新機構及技術人員基於“悟道”大模型開發新穎實用的智慧應用,賦智更行業發展,同時不斷發掘和培育基於超大規模智慧模型的創新企業,推動本市人工智慧産業可持續發展。

四、推動發展最優AI生態,支撐北京加快建設具有全球影響力的人工智慧創新策源地

開幕式上,智源研究院院長黃鐵軍教授從創新研究、學術生態、産業發展與AI治理四個方面介紹了智源研究院的工作規劃和建設進展。image.png

(智源研究院院長黃鐵軍)

 

創新研究:三大智慧模型+一智算平臺

據黃院長介紹,智源研究院已經確定將打造智慧模型作為源頭創新的核心任務,在組織架構、資源保障和機制體制上進行了系統部署,全力構建資訊模型、生命模型和物理模型“智慧三劍客”。

首先是“悟道”資訊模型,數據是智慧的素材,通過“大數據+大算力+強演算法,訓練超大規模資訊模型,為各行各業智慧化提供切實可用的共性基礎智慧模型,是當前及未來一段時間人工智慧全面賦智經濟社會發展的中心任務。然後是天演生命模型:生命是智慧的第一載體,模擬倣真億萬年進化而成的生物神經系統和身體,構建生命智慧模型,挖掘生物智慧機制機理,是發展新一代人工智慧的不竭源泉。最後是“天道”物理模型:自然是生命的搖籃,地球是人類的搖籃,構建地球環境物理模型,是實現類人智慧和人機共處共融的必要條件。建立宇宙物理模型,推動智慧走出地球、穿越時空。

構建資訊模型、物理模型和生命模型,共同需求是算力。目前北京市已支援建設超大規模智算平臺,構建體系架構先進、高速互聯互通、可擴展高效並行的軟硬體系統。

學術生態:持續實施“智源學者計劃”,成立面向海內外AI青年科研人員開展學術交流“青源會”

“智源學者計劃”自2019年4月開始實施,目標是遴選最優秀的科學家,勇闖人工智慧科技前沿“無人區”,挑戰最基礎的問題和最關鍵的難題。截至目前,已在人工智慧的數理基礎、人工智慧的認知神經基礎、機器學習、自然語言處理、智慧資訊檢索與挖掘、智慧系統架構與晶片等六大研究方向,遴選智源學者94人,分別來自北大、清華、中科院等高校院所與曠視、京東等優勢企業。

智源研究院持續推動智源社區建設,著力構建人工智慧學者社交網路。今年智源社區將緊密聯繫3000名以上的人工智慧頂尖學者,輻射10萬以上人工智慧科研和技術人員。

特別面向青年科研人員,智源研究院今年成立了AI青年科學家學術組織“青源會”,為海內外的AI青年科學家和技術人員建立的寬鬆、活躍的學術交流平臺,促進學科交叉,支援青年科學家提出具有引領作用的原創思想,開創新的科學前沿,建立活躍的人工智慧學術和技術創新生態,

産業發展:發力智慧醫療,實施“源創計劃”支援AI創業

智源研究院加快推進人工智慧深度應用,孵化AI創新企業,推動人工智慧産業發展。當前,健康醫療已成為人工智慧最熱門的研究和應用領域之一,北京在發展智慧醫療方面,有著得天獨厚的優勢。為推進AI原創成果在醫療行業落地,智源研究院成立了“健康醫療研究中心”,構建醫療大數據和高品質小數據等基礎數據,支援智慧醫療核心技術突破,加快人工智慧在健康醫療領域的深度應用。智源研究院與清華智慧産業研究院(AIR)開展深度合作,推動以“個人”為核心的、AI驅動的主動健康管理。

為推動AI原創成果轉化落地智源研究院去年啟動建設了創新中心,加速AI原創成果熟化及工程化,目前已建立了智慧資訊處理、認知知識圖譜、安全人工智慧等多個創新中心今年,智源研究院按照國家和北京市促進科技成果轉化的最新部署,積極整合技術、場景、人才、資金等資源,推出支援AI創業的“源創計劃”,為AI創業團隊開放大模型、數據集等生態資源,為來自學術界的AI科學家創業團隊對接應用場景,為來自産業界的創業團隊對接業界領先的AI技術,加快形成可落地應用的AI産品。另外,還將通過設立創業基金等方式,加快孵化一批具有國際領先技術能力的AI創新企業,為北京AI産業的持續發展儲備力量。

AI治理:推動北京共識落地,推進面向可持續發展的人工智慧

當前,AI倫理和治理成全球共識,國際社會正探索建立廣泛認可的AI倫理原則,推進敏捷靈活的AI治理。智源研究院在2019年成立人工智慧倫理與可持續發展研究中心,率先在國內開展AI倫理安全研究,並積極參與國際AI治理。AI倫理規範方面,2019年5月,發佈了我國首個AI發展與治理準則——《人工智慧北京共識》。去年9月,又發佈了我國首個《面向兒童的人工智慧北京共識》。另外, 智源研究院建設了我國首個“人工智慧治理公共服務平臺”,針對人工智慧技術研發及應用中存在的潛在倫理問題提供檢測服務,幫助AI研發機構研發更符合AI倫理規範的技術和産品。

聯合國在2015年正式通過了可持續發展目標17大項,涉及社會、經濟和環境三方面的發展問題。為推動AI技術服務於可持續發展目標的實現,智源研究院發起成立了“面向可持續發展的人工智慧國際協作網路與智庫”,目前已匯聚了來自15個國家的專家學者。同時,智源研究院也聯合百度、小米、曠視、滴滴等企業發起了面向可持續發展的公益計劃”,目前已圍繞城市治理、自動駕駛、勞動者就業影響、青少年心理影響等方面發佈了首批4個研究題目,並已啟動研究工作。後續,完成後的研究成果將會面向全球公開,服務於人類命運共同體的構建與實現。


客戶端中查看 手機中查看