打響“百模大戰”,成都大模型賽道迎來加速跑

來源:中國網 時間:2024-07-05 18:42:27 編輯:張夏桐 點擊:

7月4日,2024世界人工智慧大會在上海啟幕,聚焦大模型、算力、機器人、自動駕駛等重點領域,與“人工智慧+”相關的創新應用成果和産品備受矚目。

大會上,商湯科技、科大訊飛、星環科技等企業帶來的新一代大模型集體亮相;摩爾線程也帶來了其AI旗艦産品誇娥(KUAE)智算集群解決方案的重大升級,旨在打造專為萬億參數級別的複雜大模型訓練設計的國産通用加速計算平臺;“AI大模型産業發展的關鍵要素與創新生態”閉門研討會舉辦……吸引著全行業的目光。
近年來,全世界數十萬億級的數據被投入大模型訓練當中,一次次挑戰著開發者和硬體算力的極限,大國、巨頭加速ALL IN。在這場未來産業的激烈競爭中,成都已經成為其中的有力參與者。
今年,四川省把人工智慧作為1號創新工程精準支援。成都也接連出臺了《成都市進一步促進人工智慧産業高品質發展的若干政策措施》等相關文件。5月,成都市3個人工智慧大模型通過國家備案,實現了成都行業大模型備案的零突破。
大模型發展面臨哪些挑戰?成都能否從中找到新賽道競爭的破局點?是人工智慧産業當下聚焦的重點。
01“馭風”而行場景孕育大模型落地
目前,大模型技術在國內日趨升溫,許多廠商正在積極推進大模型在垂直領域的應用探索。復旦大學自然語言處理實驗室教授張奇認為,“推理能力”是通用人工智慧核心,目前GPT4.0在企業端直接端到端使用仍有巨大困難,大部分場景下直接使用只能達到20%至85%的準確率,因此需要對AGI的邊界有清晰認知,如何選擇場景,才是大模型技術落地的關鍵。

今年4月北京發佈的《北京市人工智慧大模型行業應用分析報告》中提到,通過舉辦人工智慧大模型創新應用大賽的形式助推大模型的技術落地。大賽設置了政務、金融、産業升級、醫療、文化教育、智慧城市6個大模型領域熱門賽道,挖掘出了一批典型的行業應用案例,梳理凝練出了大量核心業務場景和高品質行業核心數據,為大模型後續發展進行“預訓練”。
今年7月,在2024世界人工智慧大會的浦東新區人工智慧産業生態推介會上,上海浦東張江“模力社區”正式啟用。作為浦東新區人工智慧産業生態的重要組成部分,“模力社區”將為人工智慧領域的創新團隊和企業提供更加便捷的交流合作平臺,推動産學研用深度融合,加速形成大模型創新生態。
在場景應用方面,成都市深挖AI大模型在生産、生活、城市治理等領域應用實踐併發布機會清單引導科技研發。根據《成都市人工智慧産業高品質發展三年行動計劃(2024—2026年)》,成都將大力實施場景融合應用培育行動,在2026年打造150個創新應用場景,培育示範應用産品超過500個。
02搶佔賽道直面發展挑戰與機遇
如同形式各樣的城市排名,在火熱的“百模大戰”之下,大模型備案數量似乎成為人工智慧産業實力的重要指標,各地對大模型的重視程度也不斷提高。成都市場上已經誕生了一批具有競爭力的大模型:成都海藝互娛科技有限公司的“海藝繪畫大模型”,聚焦AI繪圖和視頻生成領域,滿足企業和個人個性化的設計需求;成都曉多科技有限公司的“曉模型XPT”大語言模型已經賦能電商、金融等多個行業;成都考拉悠然科技有限公司的多模態産業通用大模型已經面向半導體、煙草、城市治理等500多個高能項目……

數據顯示,國內已經推出超300個大模型,截至今年4月已經有117個大模型完成了生成式AI備案服務,其中屬地位於北京的有51個、上海24個、廣東19個……百花齊放、百家爭鳴的同時,“百模大戰”也逐漸進入白熱化階段。
目前成都在“百模大戰”中處於什麼位置?四川省人工智慧研究院副院長、四川省人工智慧行業協會秘書長陳章表示,根據他的觀察和推斷,成都已通過備案的大模型數量大概處於全國第六、七名左右的位置,在他看來,這個排名不算太高,還可以爭取再往前靠。
03強力支撐大模型産業提速跑
總體來看,加速大模型應用落地依然是圍繞“算力、演算法、數據”開展工作。成都正利用自身發展優勢,尋找行業破局點,迎頭趕上。
增強算力基礎設施。正如沒有超高速風洞,造不出頂級的導彈和戰鬥機,沒有足夠的算力支撐,大模型訓練也難以邁進。今年的政府工作報告上提到,適度超前建設數字基礎設施,加快形成全國一體化算力體系,培育算力産業生態。要以廣泛深刻的數字變革,賦能經濟發展、豐富人民生活、提升社會治理現代化水準。

成渝地區是國家“東數西算”工程的樞紐節點之一,成都已經形成國家超級計算成都中心、成都智算中心“雙中心”格局。
可喜的是,近年來成都不斷發佈《成都市圍繞超算智算加快算力産業發展的政策措施實施細則》等算力發展相關政策,推進産業建圈強鏈,構建“超算+智算+通算+邊緣計算”多元異構算力設施,目前智慧算力規模已超過4700 Pflops,並計劃到2026年實現算力規模2萬PFLOPS,未來成都的獲得算力成本將進一步下降。

穩抓高品質行業數據。算力規模的基礎設施建設是一個漫長的過程,同時還受到摩爾定律、晶片研發實力、算力成本等多方面因素影響,打下高品質數據基礎是成都破局的重要發力點。
人民網財經研究院發佈的《2024年中國AI大模型産業發展報告》指出,國內大模型的數據缺乏多數據源的調用,可供大模型訓練的有效數據源呈現碎片化分散狀態,政府部門的權威數據、大型企業掌握的行業或內部數據通常不對外公開,仍需構建高品質的AI大模型訓練數據集,擴充數據源提高數據品質。
四川擁有全部41個工業門類,成都作為四川省會城市,利用好完整工業體系中的高品質數據,使得利用行業大模型打通“人工智慧+”最後一公里成為可能。
今年5月,第七屆數字中國建設峰會舉辦,成都獲批成為全國首批7個數據標注試點基地之一。成都已建成覆蓋全市2140余萬常住人口和390余萬法人等系列基礎數據庫,向社會公眾開放數據3億條;授權運營公共數據575類5.7億條,數字城市競爭力排名全國第5。
通過數據標注,可以將原始數據轉化為機器學習演算法可理解的形式,是新一代人工智慧發展的關鍵抓手。參考北京人工智慧數據訓練基地,若能有效組織數據供給方、加工服務方、模型訓練方“進場”合作,推動高品質數據價值釋放,將對通用模型和行業垂類模型訓練精調提供極大助力。
相信只要找準突破口,隨著大模型技術奇點的到來以及行業標準化體系的建設與完善,成都規劃中的人工智慧萬億級市場定能實現。(張夏桐 陳夢雪)