2023世界人工智慧大會|大模型等AI技術助力場景創新,激活産業發展新動能 | 首播即爆發,寶藏作者組團入局抖音電商 | 安芯網盾獲阿布扎比政府支援,走出一帶一路網安企業發展新步伐 | 中國糧油學會赴山西調研助力鄉村振興 | 數策指今方便檢智慧尿檢小便池,讓公廁成為健康流量財富聚集地 | WAIC 2023:竹間智慧推出「99萬實驗室」,與企業共建大模型 | 國內首個校對垂直領域大模型“蜜度文修”重磅發佈 科大訊飛與蜜度進行合作簽約 | 成為未來“智”光!Yeelight易來跨入智慧照明新時代 | 海龜爸爸 x 抖音電商新銳發佈|創新新品類,推進新銳品牌大眾化破圈 | 小紅薯快閃店:突然就熱了的 10 位小紅書熟人(作者),分享他們在小紅書上嘗到的小甜頭 |
 
當前位置: 新聞>滾動>

媒體專訪:零點有數董事長袁岳,演算法産業化應更多聚焦中模型發展

發佈時間:2023-07-10 08:31:04  |  來源:中國網科學  |  作者:  |  責任編輯:科學頻道

【編者按】袁岳,零點有數董事長,黑蘋果青年公益理事長,飛馬旅聯合創始人,獨立媒體人,發表關於數據科學、管理科學、社會群體研究等相關領域著作逾一千三百五十萬字。2021年袁岳接受媒體專訪,就“演算法産業化”進程中的機遇與挑戰分享了洞見,現推出袁岳專訪2.0版本,深化大模型背景下演算法模型發展的新議題。

一、演算法模型:人工智慧的基礎組成部分

ChatGPT作為人工智慧領域的熱門話題之一,引發了公眾對大模型的關注熱潮,並將其視為一個新興概念。袁岳在專訪中表示,實際上,"演算法"和"模型"可以理解為同一概念,在我們談論人工智慧時,演算法模型作為其核心的基礎組成部分,不僅在模型精度上,在表達技術和系統鑲嵌方式上也存在差異。

未來的人工智慧在實現其功能時需要多個系列的演算法模型來支撐,把整個演算法系列叢串聯起來,可以直觀地看到若干演算法模型的組成。

首先,讀取演算法在人工智慧中扮演著關鍵角色,它能自動閱讀不同形式的數據,包括視覺、文本、數字,還是掃描探頭中的數據,並承擔著學習和數據分析的任務。最後數據讀取完成後,再通過分析演算法進行數據分析,進一步做出相應的決策或針對性行動。

袁岳強調,不論是推理、預測、判別、搜索、推薦、匹配、治療、危機管理還是人員調度等任務,都涉及特定類別的演算法模型。這些模型在協同工作中形成一個完整的人工智慧系統,為公眾提供了優越的決策支援和行動能力。未來,這些模型將不斷優化,為各領域發展帶來更廣闊的應用前景。

二、大中小模型關聯:模型複雜程度和應用範圍的遞增

袁岳指出,從小模型,中模型,再到大模型,其實可以看作是模型複雜程度和應用範圍的遞增關係。

附圖袁岳在第三屆BPAA演算法應用實踐典範進行主題分享

小模型通常用於解決具體的問題或細節場景,以股票交易為例,通過簡單演算法的開發,可設定一個止損點和最佳賣出點,當股票上漲到某個閾值時則自動賣出股票,同樣地,當股票下跌到一定程度時也將自動賣出,以免造成更大損失。

而大模型具有通用人工智慧的特點,涉及高密度技術學習技術、演算法模組的自動組合技術,從而使其預備更強的遷移使用和演算法生存能力。以ChatGPT為代表的大模型為例,其在開始階段就涵蓋多領域的演算法模組,具備更豐富的模組組合能力、跨領域和多領域的行動能力及決策指導能力,能夠實現聊天、決策等多種功能。另一方面,大模型也為我們利用技術學習和演算法生成技術來高效建設中小模型提供了重要基礎。

中模型則介於小模型和大模型之間,在特定領域中發揮作用。例如在相親網站上找對象,需要收集各類資訊,考察其在不同維度上的表現,然後進行綜合判斷。在這種情況下,對演算法的準確性和精度要求較高,需要整合多個演算法模組,形成一定規模和密集度的中模型。

如果把基礎演算法作為我們得以展開技術建模的演算法基本工具庫看成一層樓,那麼通用演算法就是二層樓,而GPT類的大模型建設為我們開發應用演算法累積了足夠強悍的二層樓機制,它不僅為很多主體提供了便捷的問題探索解決方案,還為處在三層樓的我們在特定領域開發垂直應用演算法提供了高效的支援。“因此,我們今天需要形成起碼的小模型開發能力,在中模型領域形成實際的操作能力,再邁向具有實際意義的大模型建設。”袁岳表示。

三、開源的演算法資源庫對人工智慧發展至關重要

演算法本身的快速發展高度依賴於開源,作為應用演算法的開發工具和基礎條件,開源的演算法資源庫對人工智慧發展至關重要。全球範圍內,美國網際網路大廠、軟體巨頭和歐美相當部分的電腦大學為基礎演算法的開發和開源做出了最重要的貢獻,在大模型和中模型部分也匯集了大量開源的通用演算法和技術。袁岳提到,目前GPT-3.5和GPT-3.0已經在很大程度上進行開源,國內的大模型項目也提供了開源和API接入合作,大幅降低技術更新成本,極大地改善了演算法開發和演進的通道。

附圖 BPAA第三屆應用演算法實踐典範正式啟動

開源的另一個意義在於模型的高度重復使用性。例如在智慧政務領域,我們不再需要所有部門建立系統和演算法,而是通過高度可復用的模型進行開發。在各行政部門解決類似問題的情況下,可以復用和調用其中的模組技術,通過重新整合和組合不同的可調用模組技術,更快、更高效地開發出新的深度解決問題的演算法模型。因此,即使在規模龐大的情況下,開源和有限範圍內的共用也能夠極大地提高數字化的效率,同時降低數字化成本,極大減少重復建設的投入。在這樣的背景下,演算法模型將以更高的水準拓展,為社會提供更優質、更智慧的服務。

“總的來説,演算法模型是值得投資的領域。”袁岳表示,儘管對於僅擅長或熱衷於提供系統平臺開發和重復開發的數字化技術企業來説,這並不能算是好消息,因為其生意總量在減少,但從可持續性和真實需求的角度來看,特別是在當前經濟增長面臨巨大挑戰、政府財稅能力受限的情況下,通過演算法模型的發展進入到數字化內容建設階段和高精度智慧建設階段是十分重要且必要的。這個階段性價比更高,具有更清晰的建設目標和更高的建設精準度。

四、加強中模型投入,聚焦垂直領域和關鍵領域

針對最近一些業界人士有關中模型投入的觀點,袁岳表示贊同:“我們當前在演算法模型的發展方面應聚焦于垂直領域和關鍵領域,並在這些領域積累基礎數據語料,訓練出足夠精度的模型,並將其匯聚成具有領域解決能力和競爭力的綜合性解決方案。從我自身的觀點和敏感度來看,中模型領域是一個重點發展方向,我認為這種方法更具範例性,也更具投資價值。”

附圖第三屆BPAA應用演算法實踐典範圓桌論壇

袁岳表示,一方面,演算法模型的發展將改變對數據的要求,推動和優化數據的價值體現、供應能力和交易方式。模型的應用精度將隨著數據不斷豐富而提高,同時隨著演算法模型不斷優化,其數據處理效率和數據復用能力都將顯著提高。

另一方面,先進的演算法需要更大的算力支援,演算法的不斷進化對算力的要求不斷提高,需要高精度和高通量的演算法支援,因此,對於建設算力中心和提供算力支援的要求變得更加明確、精準和清晰。從這個意義上説,演算法實際上定義了算力和算量發展的最新方向和要求。

五、與國際相比,我國演算法模型發展仍缺乏競爭力

袁岳認為,與國際相比,我國演算法模型在整個大模型項目中缺乏競爭力。儘管科技部新一代人工智慧發展研究中心發佈的《中國人工智慧大模型地圖研究報告》(以下簡稱為《報告》)顯示,中國研發的大模型數量排名全球第二,僅次於美國,但實際上我們能夠真正達到大模型水準的數量有限,能與ChatGPT匹敵的模型更是沒有,無論是在投入準備、開發目標還是應用經驗方面,目前仍然沒有與GPT技術相對應的解決方案。

《報告》顯示,我國參數規模在10億以上的大模型數達79個,其中約有1/3的為通用大模型,其餘2/3被稱為行業垂直大模型或行業應用大模型。

在這些通用大模型中,僅有1/5具備多領域的語料標注和實際場景的訓練和應用經驗,其餘4/5的模型是基於GPT或準GPT等開源演算法技術進行整合。這些整合提供了一些基礎工具和支援,但由於缺乏特定領域或場景的語料和基礎數據進行模型訓練和實際應用的實踐與探索,也可稱為大模型殼兒或技術框架。

行業垂直大模型在某個或多個領域中具有豐富的應用功能,積累了領域內的語料標注、模型訓練和應用經驗,並提供了一些解決方案。然而實際上,這些模型中預訓練模型、生成模型或為特定場景提供的解決方案數量很少,甚至有的尚未付諸實踐。

袁岳表示,從這方面上看,在數字化解決方法中,演算法模型的投入需求已十分迫切,亟需加強對關鍵領域的投入和投資,包括演算法模型的開發,以及演算法模組和演算法系列的構建。

六、演算法模型建設需加強垂直化機制、智慧化建設和內容建設

在採訪中,袁岳提到,當前演算法模型建設面臨重重挑戰,任重而道遠。各地的人工智慧項目、智慧城市建設和智慧行業建設對於模型開發的預算不足,合作夥伴、客戶和供應商之間對於模型開發投入方面的觀念和結構也沒有發生重大調整。從這方面來説,我們不僅需要在演算法模型領域進行投資,更需要加強對垂直化機制、智慧化建設和內容建設的投入。

在人才建設方面,袁岳表示目前也存在較大缺口。演算法模型領域的前進步伐需要更多實用的前沿人才提供支撐,而現有人才教育機制的滯後性需要演算法模型行業積極投身到演算法模型人才培訓的一線,提供從系統概念、開發技能,到應用方法、實案訓練的全程支援。

附圖 BPAA演算法應用實踐典範200強團隊

在大模型熱的背景下,應用演算法為中模型及行業應用大模型的發展提供了更好的運作環境和技術基礎,為演算法人才發展、部署和投入提供更多支援。袁岳在採訪中分享:“從2020年上海世界人工智慧大會上提出要重視演算法産業化建設,到如今連續三年成功舉辦BPAA演算法應用實踐典範,我們每年都積累了優秀的演算法模型TOP50代表,而在第三屆新設置創新組和創業組,分別評選TOP50演算法模型代表,迄今為止積累了200強演算法團隊。這些團隊是中國本土演算法模型的先行者,是在中、小模型已有成就的建設者,也是未來大模型建設重要的支援力量。”

在採訪最後,袁岳提出,在數字新基建的浪潮中,上海市首先強調演算法要素建設,于2021年推出《上海新一代人工智慧演算法創新行動計劃》,同時在普陀區也形成了屬於自己的演算法發展特色,為BPAA人才落地提供了有力支援。期待更多演算法人才和團隊能夠加入進來,助推上海演算法産業化高品質發展。