財經 > 産經 > 正文

GPT-4o多模態能力再提升多家上市公司加速推進AI應用落地

2024年05月16日02:00 證券日報

新聞爆料:finance@china.org.cn 電話:(010)82081166

　　近日，OpenAI發佈了新一代旗艦生成模型GPT-4o（“o”代表omni，即全能的意思）。據悉，GPT-4o為面向未來人機交互範式的全新大模型，具有文本、語音、圖像三種模態的理解力，反應極快還帶有感情，也“很通人性”。

　　開源證券研究報告介紹，GPT-4o有四大特點：一是多模態能力大幅提升，可以跨文本、音頻和視頻進行實時推理；二是更加“像人”；三是毫秒級響應，API（應用程式介面）成本更低；四是擁有3D視覺內容生産能力。

　　全球大模型競爭加劇

　　據悉，GPT-4o將免費提供給所有用戶，OpenAI還將推出桌面版ChatGPT，輕量化的使用體驗可以融入任何工作流程中。

　　“GPT-4o作為一個具有多模態能力的生成型模型，將在客戶服務、醫療保健、教育、娛樂、無障礙技術等諸多領域發揮重要作用，助力相關領域的AI應用‘更加好用，性價比更高’，更好地打開應用商業化空間，也會加劇全球各大模型廠商的競爭。”中國電子商務專家服務中心副主任郭濤在接受《證券日報》記者採訪時表示。

　　近段時間，不少海內外行業巨頭頻頻發佈大模型最新成果。例如谷歌發佈升級版的最強大AI模型Gemini迎戰GPT-4o，谷歌CEO桑達爾·皮查伊表示：“谷歌所有的工作都圍繞生成式AI模型Gemini來做，希望每個人都能從Gemini所做的事中受益。”

　　國內的知名私募巨頭幻方量化旗下的AI公司DeepSeek（深度求索）發佈全新第二代MoE（混合專家）大模型DeepSeek-V2，該模型擁有2360億個參數，其中有210億個活躍參數。

　　崑崙萬維正式將天工大模型迭代至3.0版本，據悉“天工3.0”採用4000億參數MoE架構，是目前全球模型參數最大、性能最強的開源MoE模型之一。“天工3.0”在語義理解、邏輯推理等方面能力實現質的飛躍，其技術知識能力較上一代模型提升20%，數學、代碼等能力提升超30%。此外，百度、商湯科技等也發佈了最新多模態模型成果。

　　“OpenAI推出GPT-4o及近期海內外廠商頻頻發佈大模型迭代升級成果，競爭焦點或集中在多模態能力、Agent（指能自主活動的軟體或者硬體的智慧體）能力和API調用成本優化等，均為大模型應用落地並商業化的關鍵因素。”開源證券分析師方光照認為。

　　多家公司跟進AI應用佈局

　　多模態模型可以應用於各種終端設備，如智慧手機、平板電腦、車載多媒體端口、智慧音箱、機器人等。此外，還可以應用於企業級産品，如影視、教育、行銷、搜索、辦公等各個領域。

　　在此背景下，不少上市公司通過大模型加速推動在AI領域的業務佈局與應用。5月15日，金蝶集團發佈基於企業管理、AI、大模型三者疊加結合的金蝶Cosmic，這款應用具備感知、記憶、思考、行動能力，助力管理者及員工輕鬆應對多項管理工作。

　　主營為行銷傳播智慧服務的因賽集團日前對外表示，公司自研的行銷行業AIGC應用級模型InsightGPT，不斷取得技術突破，“圖生視頻”“文生視頻”等各項功能和産品發佈始終走在行業前列。同時，公司會密切關注世界前沿的最新技術，持續對InsightGPT各項産品和功能進行優化與迭代，適時拓展新的産品方向，目前論證可行的産品方向包括但不限于3D視頻與數字人。

　　奧飛娛樂在互動易平臺上表示，目前其持有光年無限5%股權，光年無限有自己的AI對話機器人産品——圖靈機器人開放平臺，並上線AI對話小程式“喜羊羊與灰太狼+”，定位兒童用戶，提供親子陪伴體驗。

　　字節跳動也最新發佈了豆包大模型，據字節跳動旗下雲服務平臺火山引擎總裁譚待介紹：“經過一年時間的迭代和市場驗證，豆包大模型正成為國內使用量最大、應用場景最豐富的大模型之一，目前日均處理1200億Tokens文本，生成3000萬張圖片。大模型從以分計價到以厘計價，將助力企業以更低成本加速業務創新。”

　　“擁有多模態能力的大模型將為上市公司在客服服務、教育培訓和終端應用等領域提供了廣闊的應用前景。這種全新的交互模式將為企業帶來更高的效率和更低的成本，同時為用戶帶來更便捷與愉悅的體驗。”中國資訊協會常務理事朱克力向記者表示。

(責任編輯：譚夢桐)