沒有人工哪來智慧

發佈時間:2019-10-12 09:54:37 | 來源:文匯報 | 作者:佚名 | 責任編輯:李培剛

用搜索引擎找尋中意的餐廳、在音樂App中根據標簽找到想要的歌單、對著手機上的語音助手説出想看的電影……

當我們感嘆如今的人工智慧(AI)正讓日常生活變得越來越便利快捷時,大多數人或許不知道,看似無所不能的人工智慧技術,其實是建立在機器學習演算法基礎上的。在你接觸到的人工智慧資訊和機器學習演算法背後,坐著一批有血有肉的“真人”——他或她可能會在道路的影像畫面中畫出邊界框來讓無人駕駛汽車識別一棵樹、障礙物或一個正在移動的人;辨別並標注智慧音箱中那些難懂的方言或口音;也有可能給某些內容加上標簽,這樣演算法就能定義一首“悲傷”的歌……在人工智慧這個看似光鮮亮麗的行業,這些為人工智慧機器學習演算法提供標準化基礎數據的人,有一個名字叫做 “微工人”(Microworkers),有時又被稱為“微工作”。

説到“微工作”,不能不提到電商巨頭亞馬遜。早在2005年,當亞馬遜CEO貝佐斯建立第一個眾包勞務平臺Amazon Mechanical Turk(AMT)時,他就將眾包微工作稱為“人造的人工智慧”,而“微工作”正是這一平臺的衍生物。當時,亞馬遜後臺需要篩選清除每天積存下來的超過四百萬個重復頁面,這些頁面內容基本相同,當中只有非常細微的差別,問題是,一般的電腦無法捕捉到其中的差異,為此,亞馬遜將這些頁面分揀篩選工作分成幾千個小的“工作包”,在AMT上招募臨時工對此進行人工甄別篩選——領取“微工作”的流程非常簡單:只需點擊任務連結,它就會顯示任務、你需要完成任務的時間,以及完成任務後你能掙多少錢。

目前還沒有官方數據顯示全世界有多少與數據標注産業相關的“微工人”,但據一份對亞馬遜的調查統計顯示,每月有數萬人在亞馬遜的AMT上領取工作,而在不管什麼時間,都有多達2500人處於活躍狀態,他們主要來自美國和印度。調查顯示,這些人的平均年齡為33歲,其中三分之一是女性,而在發展中國家這一比例降至五分之一。

如同一直被指責盤剝基層員工一樣,亞馬遜、甚至矽谷的其他一些人工智慧巨頭髮起的“微工作”,也經常受到媒體負面報道,因為它被認為報酬過低。不過,對那些生活在經濟不發達地區的一些人來説,“微工作”是一個不錯的選擇。來自南美的米歇爾·穆尼奧斯曾經是名牙醫,但由於當地通貨膨脹嚴重,很少人有錢來看牙醫,因此,米歇爾在兩年前關掉了辦公室,成為全球隱形“微工人”大軍的一員。米歇爾表示,“微工作”目前是她唯一的收入來源,但即便如此,現在的收入也比她之前勉強維持牙醫診所時更高。她現在的最高紀錄是一天賺了80美元,“微工作”一個多月下來,竟然可以買一部現在工作中會用到的智慧手機。

在國內,隨著近來人工智慧産業的崛起,從事與數據標注、篩選相關的“微工作”人群也在迅速增加,其中又以為語音、圖片等相關數據進行語義理解及標注服務最為普遍。在各類招聘網站上,可以看到每個月都會有大量寫明“鑒別標注智慧語音交互産品錄音”的“微工作”被分包出去,其中,標識一份一小時有效時長的錄音“工作包”,報酬只有100元。有業內人士稱,一個新手標注完成這件錄音“工作包”,大約需要30個小時,折算下來平均時薪只有三塊多錢。

根據相關媒體的報道,國內“微工作”的從業者主要集中在三、四線城市,以剛剛踏上社會的年輕人為主,學歷普遍較低。雖然報酬低,但好在幾乎沒有技術和資金門檻,所以“微工作”對那些欠發達地區、時間有富餘的人群來説,還是有一定吸引力的。而且靠著“集腋成裘”的規模效應,這一領域近年來也産生了一批具備相當規模的“頭部企業”。以曾經申報科創板的海天瑞聲為例,公開資料顯示,這家成立於2005年的企業,其主營業務為“人工智慧上游的數據資源服務”,服務場景包括人機交互、智慧家居等,其客戶包括阿里巴巴、三星、騰訊、微軟、百度,2018年,來自這五家巨頭企業的業務量總計為1.1億元,貢獻了這家公司2018年營業收入的六成。而根據相關媒體的報道,海天瑞聲的部分業務,正是依靠兼職外包人員完成的。

法國國家科學研究中心的保拉·圖巴羅教授表示,“微工作”不是一種暫時的現象,而是人工智慧等新技術發展的結構性現象。“比如説,即使機器學會了如何識別貓和狗,你仍然需要給它們注入更多的細節讓機器更好地識別。”這意味著隨著人工智慧技術應用的普及,機器學習演算法的“胃口”會越來越大,大公司對數據輸入(其中包括要求更高的人工甄別)的需求只會更加旺盛。美國AI研究機構“感知分析”(Cognilytica)統計,截至2018年,全球數據標注相關産業的産值增長66%達到5億美元,2023年産值更將翻一番,而由於大部分工作都在“水下”,具體産值目前根本無法準確估算。有專家樂觀估計,隨著與人工智慧産業相關的業務量爆髮式增長,未來“微工人”也有可能成為稀缺資源,“微工作”的報酬“水漲船高”,也不是沒有可能。