近日,OpenAI發佈了新一代旗艦生成模型GPT-4o(“o”代表omni,即全能的意思)。據悉,GPT-4o為面向未來人機交互範式的全新大模型,具有文本、語音、圖像三種模態的理解力,反應極快還帶有感情,也“很通人性”。
開源證券研究報告介紹,GPT-4o有四大特點:一是多模態能力大幅提升,可以跨文本、音頻和視頻進行實時推理;二是更加“像人”;三是毫秒級響應,API(應用程式介面)成本更低;四是擁有3D視覺內容生産能力。
全球大模型競爭加劇
據悉,GPT-4o將免費提供給所有用戶,OpenAI還將推出桌面版ChatGPT,輕量化的使用體驗可以融入任何工作流程中。
“GPT-4o作為一個具有多模態能力的生成型模型,將在客戶服務、醫療保健、教育、娛樂、無障礙技術等諸多領域發揮重要作用,助力相關領域的AI應用‘更加好用,性價比更高’,更好地打開應用商業化空間,也會加劇全球各大模型廠商的競爭。”中國電子商務專家服務中心副主任郭濤在接受《證券日報》記者採訪時表示。
近段時間,不少海內外行業巨頭頻頻發佈大模型最新成果。例如谷歌發佈升級版的最強大AI模型Gemini迎戰GPT-4o,谷歌CEO桑達爾·皮查伊表示:“谷歌所有的工作都圍繞生成式AI模型Gemini來做,希望每個人都能從Gemini所做的事中受益。”
國內的知名私募巨頭幻方量化旗下的AI公司DeepSeek(深度求索)發佈全新第二代MoE(混合專家)大模型DeepSeek-V2,該模型擁有2360億個參數,其中有210億個活躍參數。
崑崙萬維正式將天工大模型迭代至3.0版本,據悉“天工3.0”採用4000億參數MoE架構,是目前全球模型參數最大、性能最強的開源MoE模型之一。“天工3.0”在語義理解、邏輯推理等方面能力實現質的飛躍,其技術知識能力較上一代模型提升20%,數學、代碼等能力提升超30%。此外,百度、商湯科技等也發佈了最新多模態模型成果。
“OpenAI推出GPT-4o及近期海內外廠商頻頻發佈大模型迭代升級成果,競爭焦點或集中在多模態能力、Agent(指能自主活動的軟體或者硬體的智慧體)能力和API調用成本優化等,均為大模型應用落地並商業化的關鍵因素。”開源證券分析師方光照認為。
多家公司跟進AI應用佈局
多模態模型可以應用於各種終端設備,如智慧手機、平板電腦、車載多媒體端口、智慧音箱、機器人等。此外,還可以應用於企業級産品,如影視、教育、行銷、搜索、辦公等各個領域。
在此背景下,不少上市公司通過大模型加速推動在AI領域的業務佈局與應用。5月15日,金蝶集團發佈基於企業管理、AI、大模型三者疊加結合的金蝶Cosmic,這款應用具備感知、記憶、思考、行動能力,助力管理者及員工輕鬆應對多項管理工作。
主營為行銷傳播智慧服務的因賽集團日前對外表示,公司自研的行銷行業AIGC應用級模型InsightGPT,不斷取得技術突破,“圖生視頻”“文生視頻”等各項功能和産品發佈始終走在行業前列。同時,公司會密切關注世界前沿的最新技術,持續對InsightGPT各項産品和功能進行優化與迭代,適時拓展新的産品方向,目前論證可行的産品方向包括但不限于3D視頻與數字人。
奧飛娛樂在互動易平臺上表示,目前其持有光年無限5%股權,光年無限有自己的AI對話機器人産品——圖靈機器人開放平臺,並上線AI對話小程式“喜羊羊與灰太狼+”,定位兒童用戶,提供親子陪伴體驗。
字節跳動也最新發佈了豆包大模型,據字節跳動旗下雲服務平臺火山引擎總裁譚待介紹:“經過一年時間的迭代和市場驗證,豆包大模型正成為國內使用量最大、應用場景最豐富的大模型之一,目前日均處理1200億Tokens文本,生成3000萬張圖片。大模型從以分計價到以厘計價,將助力企業以更低成本加速業務創新。”
“擁有多模態能力的大模型將為上市公司在客服服務、教育培訓和終端應用等領域提供了廣闊的應用前景。這種全新的交互模式將為企業帶來更高的效率和更低的成本,同時為用戶帶來更便捷與愉悅的體驗。”中國資訊協會常務理事朱克力向記者表示。
(責任編輯:譚夢桐)