2024年11月25日 星期一

科技 > IT業界 > 正文

字號:  

人工智慧競賽:BAT保守佈局 技術尚輸國際巨頭

  • 發佈時間:2016-06-12 07:42:56  來源:中國經濟網  作者:梁辰  責任編輯:書海

  《財經》雜誌 謝麗容 梁辰/文

  人工智慧被認為是繼電力和網際網路之後又一次對人類社會産生顛覆式影響的技術。美國公司的技術遙遙領先,中國公司擅長商業化、擁有數據優勢,在技術上正奮力追趕

  2015年12月,微軟亞洲研究院首席研究員劉鐵岩博士去蒙特利爾參加了NIPS年會(Annual Conference on Neural Information Processing Systems),這是人工智慧領域的頂級學術會議。但與會期間,他印象最深的不是同行的專業進展,而是一位科學家告訴台下的與會者,早些年,他的博士生根本找不到工作,今年卻被一搶而空。

  這也是中國正在發生的故事。從矽谷到北京,人工智慧都是熱浪滾滾。這個在上世紀50年代和80年代掀起過兩次高潮的技術,現在似乎真的到了産業化的臨界點。網際網路時代的思想家和預言家凱文·凱利宣稱,人工智慧是下一個20年裏顛覆人類社會的技術,它的力量堪比電與網際網路。

  人工智慧(Artificial Intelligence),縮寫為AI。它是研究開發用於模擬、延伸和擴展人的智慧的理論、方法、技術及應用系統的一門新的技術科學。該領域的研究包括機器人(26.660, 0.12, 0.45%)、語音識別、圖像識別、自然語言處理和專家系統等。

  人工智慧快速進入大眾視野,源於今年3月谷歌圍棋人工智慧程式AlphaGo戰勝世界冠軍李世石。人機圍棋對弈只是普及人工智慧的一個秀。它的背後是規模千億級的人工智慧産業市場。BBC預測,2020年全球人工智慧市場規模將達1190億元人民幣。

  目前看,這一數據遠比不上2015年中國移動網際網路的産業規模。但人工智慧的意義不僅於此,人工智慧技術的發展,還將帶動雲服務、大數據分析、移動網際網路和物聯網産業的升級迭代。它甚至將超越移動網際網路,全面改變人類的生活和工作方式。

  離人工智慧最近的IT網際網路公司敏銳嗅到了這一機遇。從2011年開始,包括深度學習演算法、計算資源和大數據産業的成熟令人工智慧技術實現飛躍,包括微軟、IBM、谷歌、Facebook、BAT在內的國內外企業都開始深度佈局人工智慧,試圖把握風口,成為下一個産業變革的巨擘。

  已佈局人工智慧的IT和網際網路巨頭們,最有資格成為這一輪革命的獲益者。但這終究是一個漫長的耐力遊戲,除了技術佈局,産業佈局和戰略視野也是決定成敗的關鍵因素,短視者將隨時出局。

  BAT保守佈局

  中國的所有行業中,以BAT為代表的網際網路行業在人工智慧研究和商業化探索方面走得最早,也看得最遠。其中,技術起家的百度走在最前端。

  2012年10月,百度董事長兼首席執行官李彥宏參加了內部的一個基於深度學習的語音識別産品研究會。當時該産品的主導者余凱回憶,那是李彥宏第一次知道深度學習,他非常吃驚,並給全公司寫信,讓所有産品經理都要了解人工智慧技術的發展。

  當年12月,李彥宏開始和余凱討論成立深度學習研究院的可行性。次年7月,這個研究院成立,李彥宏任院長,余凱為常務副院長。這是中國公司裏的第一個人工智慧研究院。

  李彥宏很快將相關技術投入到搜索的核心業務中。2014年的百度內部統計數據顯示,深度學習技術的應用,讓百度和競爭對手的Diff(different,內部叫Diff)指標提升了若干倍。

  但人工智慧的科研,尤其是基礎科學研究,是一個冗長寂寞的過程。此後,迫於財務數據和競爭壓力,百度的決策者們更加注重眼前的佈局和資源。

  “到了後期,太長遠項目,或是比較創新的項目,百度總部確實不太支援了。百度i站的項目、百度快搜這樣的項目沒了。”一位不願具名的前百度人工智慧研究崗位人士評價。一位現任百度相關人士對《財經》記者表示,百度前些年確實剔除了不少經過驗證沒有商業化前景的分支項目,但最近兩三年,百度明顯加大了在人工智慧上的投入,包括無人駕駛汽車等長期項目。

  6月8日,在2016百度聯盟峰會上,李彥宏將百度無人駕駛汽車稱作“一台帶輪子的電腦”。他現場播放了百度無人車路測的實況錄影,百度無人車已經可以像正常車輛一樣加速、並線、超車,他同時表示,三五年之內,無人駕駛一定可以成為現實。

  從整體來看,百度仍是BAT三家中首先完成有關人工智慧技術體系整合的公司。目前,百度研究院、百度大數據、百度語音和百度圖像等技術都已歸入人工智慧技術體系。李彥宏多次向外界強調,百度未來的發展將嚴重地依賴人工智慧。

  IBM研究院一位人工智慧專家告訴《財經》記者,百度是被他們列入競爭列表的唯一中國公司。

  矽谷尤其關心“百度大腦”的進展。百度大腦是百度在人工智慧領域的核心。百度此前發佈的諸多人工智慧産品,如無人駕駛、智慧搜索等,都是基於百度大腦的能力。

  百度高級副總裁、自動駕駛事業部總經理王勁稱,百度大腦已具備視、聽、説和預測、規劃決策以及行動控制的能力。在數據方面,百度有萬億級的網頁、移動和行為數據可供分析。在深度學習方面,百度的萬億參數排在世界第一。

  2015年,百度的研發投入超過100億元。佔百度2015年總營收663.82億元的15%。

  百度正在計劃將百度大腦在金融、汽車、醫療等領域商業化。李彥宏稱,人工智慧的“井噴式”創新,將推動網際網路進入第三幕,並將重構傳統産業。比如“人工智慧+金融”,可以快速地實現徵信升級,實現“秒放”貸款。

  阿里巴巴和騰訊的佈局則更加克制。或者説,它們更代表中國公司的普遍做法,從業務驅動開始,逐漸加大檔位。

  阿裏從2011年開始佈局網際網路醫療,投資收購和戰略合作的公司數以百計。圍繞醫院、醫保、醫藥做了大量佈局。最新的統計數據顯示,全國已經有超過400家大中型醫院加入阿裏的“未來醫院”計劃,覆蓋全國90%省份。阿裏雲人工智慧首席科學家閔萬里博士告訴《財經》記者,阿裏在健康醫療領域的佈局快慢,取決於阿裏在人工智慧領域的技術突破。

  阿裏的設想是,未來,在阿裏遍佈全國邊遠山村的醫院醫療點裏,病患足不出戶,只需拍一張CT,通過遠端技術來完成專家級的診療過程。這種診療,依賴的就是基於阿裏雲的人工智慧醫療系統。隨著學習數據的不斷增加,機器會變得越來越聰明,最終成為一個“永不退休的醫學專家”。

  多位接受《財經》記者採訪的專家評價,阿裏這個技術並不複雜,醫療診斷是基於經驗的專家型勞動,是機器擅長的經驗學習,三年內該技術便可成熟。

  閔萬里告訴《財經》記者,要實現這個目標,除了技術平臺,還需要整個醫療體系的打通,需要政府和社會共同推動設備和資源的開放。一旦打通,聚合在一個人工智慧服務平臺之上,就將衍生出更多的應用服務場景,從而實現“商業和技術互為驅動”。

  阿裏是目前中國所有公司裏,數據生態最完善、最健全的公司。iPIN創始人兼CEO楊洋認為,阿裏的MaxComputer數據通道,是非常健康的數據大動脈,可以將阿裏的所有數據資源非常高效地結合在一起。

  此外,阿裏雲也是目前世界上最接近AWS(亞馬遜雲服務)的雲計算平臺。數據生態體系是做人工智慧的重要基礎。因此,在這場有關未來的佈局中,阿裏雲的主導地位清晰。

  阿裏的人工智慧研究分散在其各個業務分支之中,有待整合。閔萬里説,阿裏希望在演算法能力上有所突破,這需要一個集中的技術機構來整合阿裏的所有相關技術資源。

  騰訊和阿裏的情況類似。騰訊在人工智慧上的佈局,以IM和SNS業務為基礎。例如語音識別主要是在微信部門、圖片識別主要是在QQ,支付和金融業務方面植入了人臉識別,搜索部門則關注自然語言識別。

  其中一些技術已在騰訊內部實現産品化。SNG(社交網路事業群)的優圖團隊聚焦圖像識別領域,推出了黃圖識別功能,併為騰訊內部産品如圖片優化工具“天天P圖”提供技術支援。WXG(微信事業群)則人機互動領域的拓展,也對圖像和語音識別進行了原發。WXG推出了智慧機器人“小微”,用戶可以用自然語言與之溝通,解決此前語音助手智慧機械應答的短板。對於未來,工程師希望“小微”成為一種“連接器”——與微信支付串聯起來,接入微信公眾號以及錢包內的各種生活服務,打造完整的微信內O2O閉環生態體系。

  騰訊高級副總裁姚星在接受《財經》記者採訪時表示,騰訊越來越重視在人工智慧領域的技術開發,這包括兩個路徑:一是整合騰訊自身的技術資源,形成體系和重點;二是加快對優秀公司的收購和合作步伐。

  騰訊參與了多個人工智慧項目的早期投資。騰訊投資並購部一直在為公司尋找需要的標的,服務於騰訊的整體戰略。騰訊日前與矽谷風投機構Felicis Ventures領頭了人工智慧創業公司Diffbot 1000萬美元的A輪。這家公司通過人工智慧技術,讓“機器”抓取網頁關鍵內容,並輸出軟體可以直接識別的結構化數據。

  BAT的人工智慧技術研發從第一天開始就是商業需求驅動的,他們從業務入手,收購甚至模倣別人的東西,這種做法避免了漫無目的研究和不必要的失敗,但也無法保證在下一輪的人工智慧平臺大戰中勝出。

  今年,阿裏和騰訊均有組建人工智慧研究院的想法。姚星對《財經》記者説,很快,騰訊人工智慧研究院就會成立。

  國際巨頭深入無人區

  如果説BAT的人工智慧佈局處於對標和追趕的狀態,那麼以IBM、微軟、谷歌、Facebook為代表的美國巨頭公司已經開始深入科技無人區。

  這些公司技術和業務各有所長,面向的用戶也不同,但它們的目標一致:把人工智慧機器做大、做強、再做沒。

  IBM和微軟可能沒有谷歌、Facebook看起來那麼酷,但在人工智慧領域有深厚的技術底蘊,IBM甚至已經開始用人工智慧賺錢。

  IBM人工智慧研究可以追溯到1997年“深藍”戰勝當時的西洋棋世界冠軍卡斯帕羅夫。2011年,代表著IBM在認知計算領域最先進技術的Watson在一個電視節目中一戰成名,被認為是人工智慧歷史上的一個里程碑。

  今天可以代表IBM在人工智慧領域最高技術水準的,是不斷進化中的Watson系統,和已經可以量産的人腦模擬晶片SyNAPSE(超大規模神經突觸電腦晶片)。

  Watson是一台超級電腦,最初由90台IBM的Power 7伺服器並行組成。和Google、微軟的人工智慧相比,它從硬體晶片構架就開始模擬人類神經元,基於IBM的“DeepQA”技術開發。2014年1月初,IBM宣佈組建“Watson Group”,旨在進一步開發、商用和增強“Watson”及其他認知技術,此外還投入10億美元用於其他相關項目。

  Watson已經開始為IBM賺錢了。法國農業信貸銀行預測,Watson系統創造的收入將在2018年佔IBM總收入的12%以上。Watson已經被部署在IBM去年收購的雲計算基礎設施業務Softlayer上,成為IBM與亞馬遜、谷歌、微軟等大型科技公司在雲計算領域展開競爭的武器。

  另一個代表性産品是IBM在2014年發佈的人腦模擬晶片SyNAPSE。該晶片能夠模倣人腦的運作模式、低功耗,在認知計算方面要遠勝傳統計算架構。和其他晶片公司的紙上規劃不同,這款晶片已達到量産要求。

  IBM將其技術和商業實力總結為“認知計算體系”。IBM大中華區副總裁、戰略部總經理郭繼軍向《財經》記者表示,IBM推動認知計算體系,目標是把IBM在人工智慧、大數據、深度學習、模式識別等所有領域裏所做的積累應用到各個行業中去,幫助各行各業客戶提升效率,解決他們所面臨的現實挑戰。

  微軟人工智慧技術的研究已超25年。1991年微軟成立研究院,最早的五個研究組,研究方向分別是人機交互、自然語言處理和機器學習、語音識別和語音合成、電腦視覺。這些恰恰是今天人工智慧的幾個最重要的分支。

  微軟的人工智慧研究方向要寬泛很多,微軟研究院擁有超過1000位科學家,在包括深度學習的多個領域的技術佈局處於世界頂端。

  微軟最新的深度學習系統在2015年ImageNet電腦視覺識別挑戰賽中,將電腦視覺系統錯誤率降低至3.57%,相比於人眼辨識的5.1%,這是人工智慧首次在識別圖像的錯誤率上超越人類水準。這些機器由微軟的Azure雲服務提供支援。

  微軟不僅將人工智慧技術應用於如Windows、Azure等核心業務中,還構建開放的平臺,將多年的技術積累開放給産業界,它的目標是打造一個人工智慧生態圈。

  它在無人區走得最遠,在現實商業世界中隱蔽得最深。

  和前輩相比,年輕的谷歌在人工智慧領域做的事情更讓外界看得懂,也更興奮。谷歌一方面不知疲倦地做底層人工智慧技術的積累,研發更加高級的深度學習演算法,增強圖形識別和語音識別能力。另一方面親力親為佈局了包括智慧家居、自動駕駛、機器人(2013年收購了8家機器人公司)等領域,前者為後者帶來基礎技術支撐,後者為前者提供數據和反饋。

  值得一提的是,谷歌在無人駕駛汽車領域的技術積累,已經遠遠超過傳統汽車廠商和其他網際網路公司。

  更加年輕的Facebook,將人工智慧視為未來的三大方向之一。Facebook天然擁有全球範圍內的海量社交數據,但在基礎科學的研究上依然不遺餘力。2013年,Facebook在加州成立了Facebook AI Research (FAIR)。卡耐基梅隆大學機器人係博士、Facebook人工智慧組研究員田淵棟稱,FAIR的研究方向自由寬鬆,研究所需的計算資源(如GPU)相對豐富,同時也沒有近期的産品壓力,可以著眼長遠做困難和本質的研究。他稱,這樣的學術氛圍在各大公司是極其少見的。

  如果説前述幾大巨頭都是從人工智慧技術出發,結合雲計算賦予技術更多勢能,那麼亞馬遜的路徑正好相反。亞馬遜是全球第一大雲服務提供商,它的雲服務收入超過微軟、IBM、谷歌、Salesforce等所有對手的總和。但亞馬遜目前發佈的人工智慧技術,多數集中在提升購物體驗的深度學習領域。

  人工智慧技術有兩大要素:核心技術平臺和數據迴圈。只擁有技術是不夠的,需要業務和數據結合,才能打造好的技術。對迴圈數據的獲取,巨頭們也都不遺餘力。

  以最熱衷開源的微軟為例,去年,微軟髮布了“牛津計劃”(現更名為“微軟認知服務”),這是一個基於微軟雲平臺的智慧API(應用程式編程介面),涵蓋了五大方向的人工智慧技術,包括了電腦視覺、語音、語言、知識、搜索五大類API。去年夏天火爆的How-Old.net,就是借助該平臺快速開發出來的一款應用,一共只有20多行代碼。

  類似的工具包微軟還有很多,例如深度學習工具包(CNTK)和微軟亞洲研究院主導的微軟分佈式機器學習工具包(DMTK)等。

  這些對於創業公司和中小企業來説相當實用。他們不用從底層技術一點點學,在小集群上或者是雲服務上就可以直接調用。

  對於巨頭來説,演算法已經不再是競爭的障礙,數據和用戶習慣才是山頭。大量的初創企業會採用開源做很多垂直領域的業務,其中包括海量試錯和驗證,最終也會反饋回開源,而這正是巨頭們所期望的。

  做B2B生意的IBM對數據的專業度要求更高,無法僅依賴搜索引擎和大量應用的交互來訓練Watson系統,因此通過深度合作和並購來獲取專業數據。

  以醫療領域為例,IBM和多家世界級頂尖醫院合作,向醫院部署Watson的智慧系統,通過分析這些醫院的病歷、專家的治療經驗、現有的學術研究等,幫助它們制定、觀察和調整癌症患者的治療方案。在這一過程中,Watson也就有了這一領域的數據積累。

  2015年4月,IBM收購了Explorys,它是一家可以查看5000萬份美國患者病歷的分析公司。類似的收購IBM還有不少,並且出手相當大方。

  Watson已經可支援針對乳癌、肺癌和結腸直腸癌、皮膚癌等癌症的初期診斷。在皮膚癌領域,在一項對3000幅皮膚鏡檢查圖像的研究中,Watson識別皮膚癌的準確率高達95%以上。而人類識別皮膚癌的準確率只有84%。

  國內的一位人工智慧業者調侃,國際巨頭在人工智慧領域真正有價值的是它們的那些你看不見的、沒開源的、國際會議上含含糊糊一筆帶過的技術。“那些才是可以顛覆未來的彈藥。”

  填補斷層

  人工智慧的産業結構可以分為三層:應用層、技術層和基礎層。應用層聚焦在人工智慧和各行業各領域的結合;技術層是演算法、模型和技術開發;基礎層則是計算能力和數據資源。

  BAT擅長第一層。BAT手中,天然握有全球最大的數據資源。但在第二層和第三層嚴重斷層。中國在人工智慧領域的科研水準停留在工程數學、物理演算法等工程科學的創新層面,基礎理論研究領域的人才和資源很少。

  多位接受《財經》記者採訪的中外業者認為,BAT的優勢在於海量數據,和國際巨頭的核心差距在技術。

  騰訊高級副總裁姚星告訴《財經》記者,今年初,他和騰訊的投資並購部達成了一個共識,開始大量考察美國的機器學習平臺類創業公司。一則中國這類技術公司不多;二則收購這種公司可以快速補足騰訊在演算法領域的不足。

  姚星向《財經》記者分析,同樣提供10萬個樣本給機器,優秀的演算法平臺可能只需要幾個小時,速度慢的可能需要幾天時間。

  對於海外收購,搜狗公司CEO王小川則更加直白:“國內適合收購的標的公司很少,因為根是斷的,(技術和基礎研究)源頭在國外,要到國外看。”

  在快速迭代的網際網路世界裏,即便是網際網路巨頭,單打獨鬥練獨門秘籍也會錯失良機。最佳方式,就是擁有數據和擁有技術的公司,通過各種結盟方式形成優勢互補,快速搶佔市場。

  2014年11月,螞蟻金服宣佈和曠視科技戰略合作,利用後者的人臉識別技術Face++軟體去確認開立線上銀行賬號的用戶身份,即“人臉支付”。

  Face++在人臉檢測的多項指標評測中接連拿下世界第一。2013年,在極難識別的網際網路新聞圖片上,獲得了97.27%的準確率,這個指標高於Facebook團隊。三年後,這一準確率已提高至99.5%。

  進行面部識別,需要處理大量來自面部的數據資訊,包括結構、五官以及肌肉等方面的數據分析。阿裏雲為這個合作注入自身的數據和分析能力。

  “凡是花錢解決的問題都不是問題,阿裏可以自己完成這些事情,但時間成本是相當昂貴的。”閔萬里對《財經》記者説,“阿裏有1000件同級別的事情要做,能做好的只有其中幾件,剩下的用投資+合作,這是時間和資本效率最高的做法。”

  技術和數據的結盟並不限于BAT,更多的公司希望通過結盟方式獲得未來,新的巨頭或許從中誕生。

  搜狗CEO王小川的思路是社交化,做更多連接,通過建設社群關係,把人大腦裏的智慧表達出來,從而解決目前搜索技術存在的內容不夠精準和實用性較差的問題。2013年騰訊入股搜狗後,先後向搜狗開放了微信公眾號數據和QQ興趣部落,為搜狗輸入數據資源。除此之外,搜狗還在去年11月戰略投資知乎1200萬美元,全面接入知乎內容。

  王小川想讓搜狗的人工智慧機器不斷學習社群數據,他對《財經》記者説,“人工智慧下一個五年不在於人工智慧本身,而是讓機器找到人。”

  今天,技術和數據的天然開放性讓各公司之間的競爭變得“我中有你、你中有我”,最終的贏家是可以將技術和數據平衡利用,達到平臺效益最大化的公司。

  微軟亞洲研究院常務副院長芮勇認為,橫向對比,中國和國際領先公司在核心技術上確實存在差距,國外更加注重基礎研究和技術研發,國內企業可以將國外的研發工具化、商業化;從縱向看,中國在人工智慧領域的技術積累近幾年確實出現了飛躍,無論是最底層的電腦體系架構,還是智慧硬體,或是上層軟體應用,都有質的進步。

  “只要不太急於求成,持之以恒地投入,中國的人工智慧産業相當值得期待。”芮勇説。

  擠出泡沫

  馬雲在一次內部講話中強調:“全球都在講人工智慧,到了風口浪尖,在創新面前,沒有第二隻有第一,創新落伍了,你就輸了。”

  焦慮的不僅是BAT,華為公司創始人任正非5月30日在全國科技創新大會上發言提到,“未來二三十年人類社會將演變成一個智慧社會,其深度和廣度我們還想像不到。如果不能堅持創新,遲早會被顛覆。”

  開放趨勢之下,人工智慧也註定不是一場巨頭間的戰爭。

  市場調研機構CB Insights的統計數據顯示,2014年風險資本對人工智慧的投資增長302%,達到3.09億美元。

  中國人工智慧領域已有近百家創業公司,65家獲得投資,共計29.1億元人民幣,其中曠視科技、優必選、雲知聲、SenseTime四家公司登上艾瑞獨角獸榜單。

  更多初創公司只是打上了人工智慧的標簽。它們本質上是用國際開源的平臺,用數據訓練一兩個模型,甚至照搬國際模型,這其實潛含危險,最大的風險是産品嚴重同質化,尤其在人臉識別、語音識別等成熟領域,這些公司的産品沒有突破性創新,根本沒有繼續走下去或被收購的價值。

  姚星常常為投資人鑒定真偽人工智慧公司。他説,辨識偽人工智慧公司有兩個關鍵點:一是這家公司所採用的技術是否是最新、最前沿的技術,如果不是,則是用人工智慧概念包裝的偽人工智慧。

  其二,這家公司的技術和業務是否具備可擴展性?若否,則是採用部分機器學習演算法或淺層人工智慧技術的商業公司,而非真正的人工智慧公司。

  iPIN是一家擁有文本認知智慧技術的公司,從去年開始,iPIN收到了不少投資機構的投資意向,該公司創始人兼CEO楊洋告訴《財經》記者,到目前為止,他還沒有遇到真正有能力鑒別人工智慧技術水準的投資機構。

  “這對於做偽人工智慧的公司絕對是一個好消息。”楊洋調侃説。

  危險在於,就算是一些初創時期確實手握人工智慧獨特技術和商業模式的公司,也在資本的脅迫下慢慢走形。

  在資本的壓力之下,一些人工智慧創業公司開始過早商業化,研發投入逐步降低,人員結構也發生變化,銷售開始主導公司,最終技術公司變成行銷公司,失去了被並購的價值。

  投資人工智慧公司,需要專業技術知識和長線投資眼光。根據Gartner的“智慧機器炒作週期圖”,由人工智慧驅動的應用中,語音識別産業化最高,自動駕駛汽車和智慧顧問處於炒作最高點,智慧機器人、自然語言處理/生成和虛擬個人助手則處於爬坡期。這些都屬於5年-10年內能廣泛普及的顛覆性技術。而神經形態硬體(如神經元晶片等)屬於10年以後才能普及的技術,但該技術可能還沒研發成熟就被淘汰了。

  需要在這一輪變革中保持耐心和恒心的還有政府和高校。人工智慧涉及電腦科學、生物學、社會學、哲學、材料學、工程學等多個學科,中國高校基礎學科的研究能力無法被充分利用,體制內缺乏一套産學研流暢對接的機制。這導致中國高校在這次産業變革中嚴重缺位。從美國的經驗來看,正是其從法律、機制上保證了産學研的平滑轉換,才令美國在這一輪的人工智慧研究中佔據上風。

  一些樂觀的投資人認為,技術發展本身就是驅逐泡沫的手段,“不用很長,一年或一年半的時間,很多真實情況就會暴露出來,泡沫也將逐漸散去”。

  • 股票名稱 最新價 漲跌幅