首頁 >   便民資訊
階躍星辰:多模態理解與生成統一,AI進化的關鍵節點
更新時間:2024-07-07 10:34:01    來源:中國網

在2024年的世界人工智慧大會(WAIC)上,階躍星辰以其Step系列大模型的全面升級和多模態技術的卓越展現,成為矚目的焦點。從語言模型到多模態模型,從理解到生成,階躍星辰正沿著多模態理解與生成統一的技術路線,探索構建具身智慧,邁向AGI的關鍵路徑。

萬億參數MoE:奠定多模態統一的基石

階躍星辰的Step-2萬億參數MoE大模型,不僅在參數量上實現了巨大突破,更在多模態理解與生成的統一中扮演了核心角色。通過自主研發而非簡單的upcycle方式,階躍星辰在MoE架構上進行了創新,包括部分專家共用參數和異構化專家設計,這不僅保證了模型的多樣性與高性能,還使其在數學、邏輯、編程等多個領域展現出逼近GPT-4的能力。Step-2的問世,為後續多模態模型的訓練提供了強大的基礎,成為多模態統一探索的基石。

多模態理解:從感知到認知的飛躍

Step-1.5V多模態大模型的升級,標誌著階躍星辰在多模態理解能力上的顯著提升。它不僅能準確理解複雜的圖表和流程圖,還能感知物理空間的幾何位置,處理高解析度圖像,甚至理解視頻中的人物情感和整體氛圍。這種感知能力的飛躍,得益於Step-2萬億參數模型的指導,通過RLHF訓練,Step-1.5V的推理能力顯著增強,能夠在圖像內容的基礎上進行數學解題、代碼編寫、詩歌創作等高級推理任務,展現了從感知到認知的深度理解能力。

圖像生成:中國元素的深度優化

Step-1X圖像生成大模型的推出,是階躍星辰在多模態生成領域的重要突破。它不僅在語義對齊和指令跟隨能力上表現突出,還針對中國元素進行了深度優化,生成的圖像更符合國人的審美風格。Step-1X採用了全鏈路自研的DiT架構,設計了600M、2B、8B三種不同參數量的版本,以適應不同場景下的生成需求,展現了階躍星辰在多模態生成技術上的領先優勢。

多模態統一:構建具身智慧的基石

階躍星辰的創始人姜大昕博士曾指出,大模型的演進將經歷從單一模態發展到多模態融合,再到生成與理解統一的過程,最終與機器人結合形成具身智慧。階躍星辰正沿著這一路徑,通過Step-2、Step-1.5V和Step-1X等模型,探索多模態理解與生成的統一,為構建具身智慧打下堅實基礎。從語言到視覺,從理解到生成,階躍星辰的每一步探索,都是AI進化史上的重要節點。

在通往AGI的征途中,多模態理解與生成的統一是不可或缺的環節。階躍星辰通過其Step系列大模型的持續創新,不僅展示了在多模態技術上的深厚積累,更為AI行業的未來發展提供了新的視角和可能。從感知到認知,從理解到生成,階躍星辰正以堅實的步伐,引領著AI領域向著更加智慧、更加多元的未來邁進。

【相關新聞】
【直播】