7月26日,智譜AI CEO張鵬在智譜Open Day上宣佈,AI生成視頻模型清影(Ying)上線智譜清言,生成6秒視頻只需要30秒的時間。即日起所有C端用戶,都能通過清影(Ying)體驗到AI文生視頻、圖生視頻能力。
據介紹,輸入一段文字後,用戶可以選擇自己想要生成的風格,包括卡通3D、黑白、油畫、電影感等,配上清影自帶的音樂,就生成了充滿AI想像力的視頻片段。大模型能真正讓用戶用上,才更加“大有可玩”。
除了文本生成視頻,也可以到清影上玩圖片生成視頻。圖生視頻帶來了更多的新玩法,包括表情包梗圖、廣告製作、劇情創作、短視頻創作等。同時,基於清影的“老照片動起來”小程式也會同步上線,只需一步上傳老照片,AI就能讓凝練在舊時光中的照片靈動起來。
清影(Ying)API 也同步上線大模型開放平臺bigmodel.cn,企業和開發者通過調用API的方式,體驗和使用文生視頻以及圖生視頻的模型能力。
新型DiT模型架構,更高效地壓縮視頻資訊,以及更充分地融合文本和視頻內容,讓清影在複雜指令遵從能力、內容連貫性、大幅的畫面調度上具有一定獨到之處。
在生成式視頻模型的研發中,Scaling Law 繼續在演算法和數據兩方面發揮作用。“我們積極在模型層面探索更高效的scaling方式。”在智譜 Open Day 上,智譜AI CEO 張鵬表示:“隨著演算法、數據不斷迭代,相信Scaling Law將繼續發揮強有力作用。”
“本次清影(Ying)底座的視頻生成模型是CogVideoX,它能將文本、時間、空間三個維度融合起來,參考了Sora的演算法設計,它也是一個DiT架構,通過優化,CogVideoX 相比前代(CogVideo)推理速度提升了6倍。我們將繼續努力迭代,在後續版本中,陸續推出更高解析度、更長時長的生成視頻功能。”
(責任編輯:譚夢桐)