您的位置: 技術市場>人工智慧>

“雙十一”第11年 AI定義網購新玩法

發佈時間:2019-11-12 15:09:11  |  來源:科技日報  |  作者:崔爽  |  責任編輯:周思楊

“雙十一”來到第11年,直播風頭正勁。“所有女生”這句來自主播李佳琦的口頭禪,成為直播時代的宣言,無數人為之掏空口袋。今年“雙十一”期間,淘寶直播已經成為商家標配,服飾、美粧、食品等行業商家紛紛拿起了直播工具,有人甚至戲稱:現在還不開直播的店舖,就跟沒有詳情頁一樣。

為了更好的觀看體驗,淘寶自主研發了全新的音視頻實時通信架構,實現了大規模低延時直播,從原先5秒至7秒的延時降低至2秒以內,提升了用戶和主播的互動效率,此外,人工智慧技術還可以實時識別主播正在講解的商品,陳列在直播頁面中。

沒錯,時代的風吹到哪,技術先行抵達。直播、短視頻當道,這類“雙十一”新玩法的背後,也有不斷進步的AI。

AI助手為主播分憂

進出直播間的剁手黨成千上萬,分分鐘形成刷屏之勢,主播分身乏術。這時候,他的AI秘書就登場了。給主播打下手,提供主播問答、商品問答、優惠券問答等服務都不在話下,也就是説,你在直播間問的問題,大多都是AI助手在解答。

據阿里巴巴達摩院資深總監、阿里巴巴集團智慧服務事業部總經理趙昆介紹,AI秘書使用了自然語言理解和基於知識圖譜問答等技術,能夠精確解析直播間觀眾對於商品和主播的多種複雜表達和問法,在直播場中實現多對一溝通的高效快速響應,大比例提高直播間的客戶問題的回復率、解決率。

除了基於文字,AI客服還可以進行基於圖片的智慧問答。趙昆表示,AI客服利用圖片解析演算法理解圖片內容,結合用戶的問題,自動理解和識別截取可以回答用戶的圖片作為回答,並高亮圖片中的精確答案位置。目前,智慧圖片問答已經覆蓋了家電數位、零食果蔬、母嬰洗護等多個行業。

方便了剁手黨,賣家同樣受惠于AI。“雙十一”期間,賣家需要在短時間內製造大量宣傳圖、海報圖等,圖像智慧生成技術就派上了用場。基於圖像智慧生成技術,AI設計師可以改變傳統的設計模式,在短時間內完成大量橫幅廣告、海報圖和會場圖的設計。賣家只需要任意輸入想達成的風格、尺寸,系統就能代替人工完成素材分析、摳圖、配色等耗時耗力的設計項目,實時生成多套符合要求的設計解決方案。

據阿里巴巴達摩院資深演算法專家謝宣松介紹,目前該系統已經達到了高級設計師的水準,每秒可以提供幾十種方案、可以設計8000張不同的海報,去年“雙十一”期間,這位AI設計師就累計為20萬企業、商家設計了近600萬張圖片,消費者在天貓網站看到的各種海報和活動商品圖片幾乎都出自它手。

圖片之外,短視頻也成了標配。謝宣松介紹,短視頻智慧設計産品基於圖像智慧識別技術和視頻智慧生成技術,幫助用戶在極短時間內完成大量的商品行銷類短視頻的設計和製作。“用戶只需要輸入商品詳情頁連結或者從本地上傳圖片視頻素材,它就可以進行圖片素材解析過濾、商品理解和定位、視頻素材剪裁準備、視頻劇本導演、視頻渲染生成等一系列複雜的設計工作,並可以依據用戶的風格尺寸等簡單的個性化要求進行輸入,提供流媒體內容生成視頻的解決方案。”謝宣松解釋説。

機器翻譯幫助貨通全球

賣貨到全世界,語言不通怎麼辦?“雙十一”之前,機器翻譯技術已經經歷了升級,對話機器人可以幫助全世界中小賣家將産品詳情與評論自動翻譯成當地語言,還實現了實時AI語言翻譯的客戶服務與業務諮詢,涵蓋64種語言方向。當然,獲取商品資訊光靠看商家網頁還不夠,有問題找客服,海外消費者也不例外。在國內,承擔客服職責的是對話機器人,這兩年,它還有了國際版,專門服務海外業務平臺。

據趙昆介紹,對話機器人精通英語、法語、泰語、西班牙語、阿拉伯語等11種語言,兩周就能學一門新外語。

“今年,對話機器人新學了阿拉伯語、法語和繁體中文,並且推出了馬來語—英語、泰語—英語等混合語言問答功能。”趙昆説,“混合語言問答的情況在馬來西亞等地很常見,在當地的客服場景中,大部分用戶用英語諮詢,少數用戶用馬來語諮詢,並且常有英語、馬來語混用。對話機器人不僅要同時理解這兩種語言,還必須理解複雜的語言混用情況,並給出相應的回答。”

不過,它使用的並不是機器翻譯技術,而是一種自然語言處理技術跨語言學習(Cross-lingual Learning)。“小語種缺乏大規模訓練語料,很難通過過去的機器學習技術習得,跨語言學習能夠克服資源匱乏的瓶頸。”趙昆解釋説,跨語言學習是一種多語言的自然語言處理技術,它通過語言之間的知識遷移,借助中文、英文等語料資源充足的語言,幫助演算法模型提升理解小語種的能力,從而快速拓展機器人的多語種支援功能。借助跨語言學習技術,對話機器人還能掌握更多語言,甚至包括土耳其語、烏爾都語等小語種。

“通俗地説,語言是符號,不同的語言是不同的符號系統。想像語言所指的每個事物/知識都對應一個確定的身份標識,後者在不同的語言中被不同的符號所代表,或者説,不同語言所用的符號映射到同一個語義空間。跨語言學習做的是幫助機器理解語言所指的身份標識,並借助資源豐富的語言去學習資源匱乏的語言。”趙昆進一步解釋。

他表示,基於語言之間的交叉映射關係,對機器來説,在資源匱乏的情況下,通過將多種語言混合,學習語言間的共性,反而能比學習單一語言效果更好。2017年對話機器人初次在海外落地,用6個月學會了印尼語,又用6個月在智慧客服崗位上達成堪比中文機器人的解決能力,而現在,多語機器人新學一門語言的時間已經縮短到兩周。

聲紋識別開啟語音購元年

今年“雙十一”,語音購物千呼萬喚始出來:消費者只要對天貓精靈説出想要購買的商品,就能直接下單;如果開通了“聲紋支付”功能,還可以直接語音付款。

“語音購元年”,聽起來科技感十足,據報道,已有數百萬人體驗了語音購物,其中超過半數的用戶是首次嘗試。聲紋識別技術採用基於深度網路的注意力嵌入式模型,通過網路結構的參數設計,模擬了基於人耳感知的頻譜特徵,可以在一定程度上消除同一人在不同場景發音下的頻譜特徵差異干擾,顯著提升遠場交互下的聲紋識別性能。

説話就能付錢,如何確保安全?阿里巴巴人工智慧實驗室語音技術首席科學家聶再清介紹,作為首個達到商用級別的聲紋識別技術智慧音箱,天貓精靈的聲紋識別率已達99%,這是它支援聲紋支付功能的基礎,在支付級應用下,用戶只要通過3次不超過10秒的交互語音,聲紋識別技術就可以準確刻畫用戶的魯棒性聲紋特徵,實現超過99%的識別準確度。

不僅如此,運用中文識別的自然語言理解演算法,語音設備可以準確定位消費者需要購買的商品,以平臺大數據為基礎,依託聲紋推薦能力,為消費者進行個性化推薦。“在語音購場景,天貓精靈基於注意力記憶網路可以自主學習各個行業導購員的經驗,並結合用戶特點呈現最優的導購流程,成為最懂用戶和最懂行業的智慧導購員。”聶再清説。

此外,今年“雙十一”,消費者還可以體驗AR試粧産品,AR試粧通過標準化工具拿到彩粧色號、材質等數字資訊,通過AI+AR技術讓用戶看到同樣商品在自己臉上呈現出的不同效果。通過高效實時的精準人臉識別技術,即便在人臉晃動和大角度偏轉時,都能有很好的穩定性表現,以毫秒級別畫出商品在用戶臉上的逼真效果。新玩法背後是新技術。在屢屢刷新的成交額、令人瞠目的商業數字之外,不斷突破的技術正貼地而行。

 
分享到:
0