數字賦能文化|科技助力煥新

數字賦能文化|科技助力煥新

 

四大新功能讓生成式AI“如虎添翼”

數字空間>

時間:  2023-12-18 11:59:33  |  來源:  科技日報

生成式人工智慧(AIGC)在目前的技術領域穩居“C位”。其利用人工智慧(AI)技術,通過已有數據尋找規律,並通過預訓練大模型、生成式對抗網路等方法,自動生成各種類型的內容,例如文章、視頻、圖片、音樂、代碼等。AIGC代表了AI技術發展的新趨勢。過去傳統AI偏向分析能力,而現在AI正在生成新內容,實現從感知理解世界到生成創造世界的躍進。

  過去,人們只能使用AIGC創建碎片化的內容。現在,人們越來越多地使用AIGC創建整個世界。據美國《福布斯》雙週刊網站近日報道,AIGC技術領域正在噴涌出一些令人興奮和充滿活力的新功能,為富有想像力、有趣且有潛在用處的産品、服務和體驗(包括但不限于遊戲創作)開闢了新機會。

人們曾使用生成式人工智慧創建碎片化的內容。現在,人們越來越多地使用生成式人工智慧創建整個世界。

圖片來源:美國《福布斯》雙週刊網站

  深度學習加聊天

  近年來,隨著AI技術的不斷發展,聊天機器人在各個領域逐漸成了“香餑餑”,也成了人們非常喜歡的交互方式。基於深度神經網路的聊天機器人更是成為了研究熱點。

  這些聊天機器人由深度機器學習提供動力,但靈感來自人類大腦結構。在訓練過程中,超級電腦會讀取大量文本並進行訓練,這種訓練使聊天機器人能夠在對話中結合上下文語境,産生類似人類的文本響應。

  目前,智慧客服聊天機器人整合了這項技術。隨著這些機器人在語言翻譯、創造性寫作、理解上下文並作出有意義反應方面的能力不斷增強,這些聊天機器人也可成為忙碌的專業人士的虛擬助理。

  自然語音合成

  當大聲朗讀文本時,許多AI機器人發出的聲音聽起來不自然且令人不舒適。但科學家現在可利用文本-語音軟體領域的一些新工具,創建聽起來更加自然而舒適的合成語音。

  例如,AI文本轉語音公司ElevenLabs推出了AI配音功能,可將口語內容轉換為另一種語言,同時保留原説話者的聲音、語言模式、情感和語調。這款流行且功能強大的語音生成器讓任何人都可創建專業的畫外音。

  這些工具可將文本轉換為具有不同聲音、風格和語言的優質音頻,有望在電子遊戲和娛樂行業大顯身手,為其中的動畫角色賦予獨特的配音。它還可與其他技術,例如神經語言模型聊天機器人相結合,為用戶與名人進行“對話”創造獨特且逼真的體驗。

  圖片創作編輯

  有了新的AIGC圖片編輯工具,人們可做的將不再限于在照片上貼有趣的貓耳朵。

  AI應用程式EPIK可讓用戶生成懷舊的、90年代風格的照片。與其他最近流行的AI應用程式類似,EPIK的工作原理是讓用戶首先上傳一系列自拍照,然後EPIK使用這些自拍照生成復古年鑒照片。近期,隨著來自世界各地的名人開始在社交媒體上分享EPIK生成照片,該應用程式10月飆升至蘋果應用商店的榜首。

  EPIK並非第一個因奇妙功能而走紅的AI照片應用程式。此前,Lensa和Remini等産品也風靡一時,Lensa提供AI生成的“魔法頭像”;Remini則因其專業外觀的AI頭像而在今年夏天登上蘋果應用商店榜首。

  簡而言之,這些新工具生成上傳照片的超現實版本,且擁有一系列風格,如復古、優雅、運動等。這些照片編輯工具顯然也可應用於遊戲、電影、平面廣告或任何依賴人類圖像的東西。

  AI情感陪伴

  AI情感陪伴是指利用自然語言處理技術,來模擬、理解、表達和滿足人類的情感需求,從而提供給用戶一種類似於人類之間情感交流和支援的體驗。基於此類工具創建的模型,能真實而富有同情心地與人類討論思想和感受,進行角色扮演,幫助管理用戶的焦慮情緒。

  當然,仍有很多人對與AI建立更加親密的關係感到不舒服,但開發人員斷言,這些工具可幫助用戶更好地學習社交技能,體察自己的情緒或思維模式,管理自身的壓力,並努力改善情緒健康。

  此外,鋻於這些AI模型能模倣人類的聲音、言語模式、外表甚至性格,潛在用戶擔心別有用心之人利用這些工具實施欺詐、身份盜竊或其他犯罪行為。而這正是業界仍在努力解決的問題。

  《福布斯》網站強調稱,通過嚴格的身份驗證,例如雙因素認證、視網膜掃描、政府對數據隱私實施的嚴格規定,以及用戶更謹慎地與AI平臺共用某些數據,上述AIGC工具有望在未來安全有效地為用戶提供一系列極具創新性且極有用的功能。(記者 劉 霞)