華為開發者大會2023(Cloud)在深圳召開,華為雲發佈了盤古大模型3.0,為各行各業提供強大的人工智慧能力。華為雲人工智慧領域首席科學家田奇在一檔播客節目中表示,我們之前做出暢想,曾認為大模型將會成為人工智慧的底座,這件事目前已經變成了現實。大模型是人工智慧的作業系統,這個也是正在發生的事情。
華為雲人工智慧領域首席科學家田奇
田奇解釋説,往上看,大模型支援更多的API和插件,就像作業系統一樣,可以讓開發者更方便地調用各種功能和服務,實現更多的應用場景;
往下看,大模型與軟硬體更好地適配,就像作業系統一樣,可以讓底層的計算資源更高效地利用,降低訓練和推理的成本和時間。他介紹説,盤古大模型3.0是基於華為雲自研的昇騰910晶片和MindSpore框架訓練出來的,這兩者都是專門針對人工智慧場景設計的,可以實現高性能、低功耗、高可靠性等特點。
未來看,大模型將從千行百業走向千家萬戶,就像作業系統一樣,可以讓人工智慧真正普及到每個人的生活中。他舉例説,現在大模型需要極大的算力來訓練它,而且需要較高的成本來進行推理,很難部署到端側的設備上,比如説手機上。但是將來,隨著技術的進步和創新,可能會出現更小巧、更便宜、更強大的晶片和框架,可以讓推理成本成百倍、成千倍、甚至成萬倍地降低。這樣一來,就可以把大模型裝載在手機晶片上了。這樣一旦發生,就像大型機變成了PC機一樣,大模型從大廠獨有的優勢,能夠進入千家萬戶,手機只是一個例子,還有很多其他的設備和場景,都可以享受到大模型帶來的人工智慧服務。
田奇還談到了大模型與小模型的關係,他認為模型並不是越大越好,而是要根據不同的任務和場景,選擇合適的模型。他説,大模型的優點在於它的泛化性強,可以通過海量數據記憶各種知識和規律,然後通過少量的數據進行微調,就可以針對性地提高應用的精度。小模型的優點在於它的專業性強,可以針對某個領域或者場景,進行深入的優化和定制,提高效率和穩定性。他認為,未來的趨勢是大模型與小模型更好地協同,大模型更像一個內腦中樞,小模型更像具體的小功能。通過大模型的語言中樞,可以知道面對不同問題的時候,去調用什麼樣的專家小模型。這種大小模型的協同,大模型作為中樞決策系統來調用各種小模型,來解決行業的問題,也是將來非常值得探索的方向。