Sora
Sora,美國人工智慧研究公司OpenAI發佈的人工智慧文生視頻大模型(但OpenAI並未單純將其視為視頻模型,而是作為“世界模擬器”),于2024年2月15日(美國當地時間)正式對外發佈。
Sora這一名稱源於日文“空”(そらsora),即天空之意,以示其無限的創造潛力。其背後的技術是在OpenAI的文本到圖像生成模型DALL-E基礎上開發而成的。
Sora可以根據用戶的文本提示創建最長60秒的逼真視頻,該模型了解這些物體在物理世界中的存在方式,可以深度模擬真實物理世界,能生成具有多個角色、包含特定運動的複雜場景。繼承了DALL-E 3的畫質和遵循指令能力,能理解用戶在提示中提出的要求。
Sora對於需要製作視頻的藝術家、電影製片人或學生帶來無限可能,其是OpenAI“教AI理解和模擬運動中的物理世界”計劃的其中一步,也標誌著人工智慧在理解真實世界場景並與之互動的能力方面實現飛躍。
Sora在日語中是“天空”(そら)的意思,引申含義還有“自由”,象徵著其無限的創造潛力。
功能綜述:
Sora可以快速製作最長一分鐘、準確反映用戶提示、可一鏡到底的視頻(其他AI視頻工具還在突破幾秒內的連貫性),視頻可以呈現“具有多個角色、特定類型的動作、以及主題和背景的準確細節的複雜場景”。
Sora還具備根據靜態圖像生成視頻的能力,能夠讓圖像內容動起來,並關注細節部分,使得生成的視頻更加生動逼真,這一功能在動畫製作、廣告設計等領域具有應用前景。
Sora能夠獲取現有視頻並對其進行擴展或填充缺失的幀,這一功能在視頻編輯、電影特效等領域具有應用前景,可以幫助用戶快速完成視頻內容的補充和完善。
可以使用Sora連接兩個輸入視頻,在具有完全不同主題和場景組成的視頻之間實現無縫過渡。
Sora對於需要製作視頻的藝術家、電影製片人或學生來説,都帶來了無限可能。該模型可以深度模擬真實物理世界,標誌著人工智慧在理解真實世界場景並與之互動的能力方面實現飛躍,也被認為是實現通用人工智慧(AGI)的重要里程碑,通過不斷深入研究和發展Sora等先進模型,有望在未來實現更加智慧、高效和多樣化的視頻生成與處理技術。Sora的推出讓AIGC(生成式人工智慧)再度成為行業焦點,能否徹底“顛覆”行業也成為輿論議論的中心。
免責聲明:此文內容為本網站刊發或轉載新聞、資訊,僅代表作者個人觀點,與本網無關。僅供讀者參考,並請自行核實相關內容。如有內容不符或侵權,請聯繫我們及時處理。