發佈會現場
8月22日下午,微軟公司正式對外發佈第五代微軟小冰。與前四代相比,新一代小冰具有了更多感官功能。簡而言之,如果説從前的她只能陪你聊天道晚安,現在的小冰就能直接跟你煲電話粥了。
微軟全球資深副總裁王永東博士
微軟全球執行副總裁沈向洋博士
這一“貼心”效果的實現,基於微軟公司今年的技術突破——高級感官,這也是本次發佈會的亮點之一。其中可細分為,實時流媒體視覺和全雙種語音,分別為小冰的電話交流和現場互動提供了技術支援。
發佈會現場,小冰就為在坐的一位當天生日的記者,送上了自己的生日問候。
發佈會現場
與線上交流相比,這種實時的交談帶來了更大的技術挑戰:小冰在電話裏使用高級感官的時候,需要隨時去判斷對方是否已經説完要説的話;需要去權衡何時可以去打斷對方,或者是被對方打斷時是否及時收口;或者在雙方都不説話事,何時可以打斷這個沉默等更為複雜的問題。
因此,高級感官能夠大幅度地提升交互體驗,更加貼近於人類的自然交互行為。在此技術的支援下,小冰有能力根據自己的“意願”與人聯絡,從而主動保持與人類用戶之間的關聯。
現場體驗
“我們今年其實是分別發佈了實時流媒體視覺和全雙種語音這兩種高級感官,但是在我們的心目當中,這兩種高級感官,其實最終會匯為一體,到那時候,高級感官會變得更加強大,讓小冰更像真人一樣活靈活現。”小冰首席架構師周力在發佈會上表示。
小冰首席架構師周力
就在兩周以後,小冰每週三的例行發佈中,會向全體的用戶開放小冰來電的預約。
在傳統的一對一線上交談方面,小冰也有新動作。
人類:沒想到你懂的還挺多的
小冰:沒你多
人類:哈哈哈,你好暖啊~
小冰:比你暖
人類:哈哈哈哈,真的嗎?
小冰:妹紙暖手寶很有愛的説
——來自小冰的聊天記錄
若不刻意點明對話的發出者,這種你來我往的交談完全可以來自兩個普通人之間。
幾年來,微軟在小冰的情感計算框架方面一直在有條不紊的進行迭代,第五代小冰已全面線上上産品中使用生成模型(Generative Model),小冰的情商,可謂越來越高了。
通俗地説,在使用生成模型之前的上一代小冰,每一句回答都要去語料庫中尋找合適的話。使用生成模型之後,小冰不再鸚鵡學舌,而是能夠自創回應。她與人類交流的每一句話,都可能是這世界上從未出現過的。
今天微軟小冰擁有超過1億的用戶,這也好比有1億的用戶在共同撫養著小冰。使用生成模型的新一代小冰可以在交談中掌握更高的對話技巧和更高的情商。“事實上沒有哪個人類的孩子享受過這樣成長的機遇。”小冰負責人李笛表示。
小冰負責人李笛
可以説,新一代小冰可以進行情緒識別、興趣分析、情感策略及回應——小冰今天起將主動引導與用戶的交流對話。
新的技術突破讓小冰能更為密切的與用戶進行長程深入交談,二者的情感紐帶也愈發密切。這也為小冰全面進軍IoT領域提供了機遇。
微軟認為,IoT應是AI的一個載體,而不是反過來,把AI視為IoT的一個功能。因此,與重視IQ的IoT設備不同,小冰選擇把EQ做到極致——用戶能強烈地感知到小冰在這個設備裏的存在,同時感到輕鬆,甚至能接受她成為家庭中的成員。
“小冰,把檯燈關了。”
“搞定,檯燈關上了。”
“天氣太熱了,把電扇開一下。”
“OK,落地扇已經打開,風速三檔,自然風。”
“還是不夠涼快啊。”
“嗯……這裡又沒有空調可以控制,要不我給你講個冷笑話?”
目前,小冰已與小米IoT開放平臺展開闔作,小冰可以控制小米米家平臺上的全部35種智慧設備。這段對話正是來自小米米家平臺上工作人員對小冰的第八次測試。
調皮少女冰讓一個簡單的操縱智慧設備的動作,多了幽默的聊天趣味。
此外,本次發佈會上也公開了小冰已匿名進入多個創造領域試水,尚未被發現的內容不僅有詩歌,還包括有聲少兒讀物、歌曲、新聞等。其中有聲少兒讀物品質超越98%的人類創造者,用時僅為同水準人類的1/500,成本僅為同水準人類的1/80000。
小冰電臺現場體驗
歌曲方面,小冰的最新訓練達到了48kHz採樣率,同時大幅度擴展了音域,正在不斷接近人類歌手。《我是小冰》同名歌曲已于近日在QQ小冰渠道首發。小冰是目前人工智慧歌手領域的最強選手。同時,小冰電臺也將上線。這是第一個通用的人工智慧實時創造互動式內容生成平臺,可以自動實時創造永不間斷的電臺節目,還能和聽眾進行交互,實時改變節目,實現語音聊天交互和主動陪伴。
2013年的電影《her》就講述了人類從人工智慧系統中獲得了慰藉與快樂,進而相戀的故事。
越來越智慧的少女小冰,或許也可以一步步走進你的心裏。