近日,百川智慧與中國人民大學共同成立“中國人民大學—百川智慧大模型聯合實驗室”。高瓴人工智慧學院、資訊學院院長文繼榮教授受聘擔任百川智慧“首席科學家”。未來雙方將發揮各自優勢,持續探索大模型預訓練、檢索增強、智慧體、多模態等多個方向的技術突破和應用創新。
據介紹,文繼榮教授是國內人工智慧領域裏産學研“跨界”頂級AI專家之一,既擁有豐富的産業實操經驗,又擁有頂尖的學術科研能力。曾任職于微軟亞洲研究院,轉入學界後,牽頭創立了人大高瓴人工智慧學院;早在2020年便帶領人大團隊研發了國內首個中文超大規模多模態預訓練模型——“文瀾”,不僅研發時間上與OpenAI的Clip同期,效果也非常接近;2023年帶領團隊自主研發“玉蘭”系列大模型,有力地支撐了中國人民大學的跨學科研究。
此次以“首席科學家”的職務加入百川智慧後,依託“大模型聯合實驗室”,文教授將充分發揮他多年的跨界經驗,推動高瓴人工智慧學院的科研能力與百川智慧的技術創新應用能力深度融合,更好地探索通用人工智慧的技術突破和産業價值。
高瓴人工智慧學院自成立以來深耕人工智慧基礎理論、智慧資訊檢索、自然語言處理、大模型等領域,其在網際網路與資訊檢索方向連續兩年位居CSrankings排行榜世界第一,人工智慧領域整體實力在電腦國際權威排行榜CSRankings中位列世界第七。2023年,學院舉全院之力“All in”大模型,不斷完善大模型領域研究佈局,目前在大模型預訓練、檢索增強大模型、大模型解釋及對齊、大模型工具學習及大模型智慧體等方向的研究上已取得一系列成果。
學院的師資力量由來自麻省理工學院、康橋大學、卡內基梅隆大學、杜克大學等國際院校以及微軟研究院、騰訊等科技企業的優秀青年科學家和國家高層次人才組成,海外名校背景師資佔比約70%,其中70%的學院老師年齡小于38歲。這種年輕化的頂級研究人員配置,非常適合大模型這類變革性技術研究。
而百川智慧作為國內頭部大模型創業企業之一,具備從數據集構建到預訓練再到應用落地的全流程創新能力,能夠為模型技術創新和價值轉化提供真實落地場景。成立以來,百川智慧先後發佈了Baichuan-7B/13B,Baichuan2-7B/13B、Baichuan2-192K、Baichuan 4、“鵬城-百川·腦海33B”等12款大模型。其中,Baichuan 4在國內權威大模型評測機構SuperCLUE的評測中,模型能力行業領先,處於國內大模型第一梯隊。
雙方各展所長,共同打造“大模型聯合實驗室”,不僅能夠充分發揮高瓴人工智慧研究院在人才培養和技術創新等方面的優勢,還能通過百川智慧豐富的産業經驗和資源迅速對技術創新進行價值轉化,從而形成産學研融合的良性迴圈,對構建國內健康的大模型生態,提升國內大模型整體競爭力都具有積極作用。
(責任編輯:王晨曦)