揭秘人工智慧訓練師:新職業,給AI當老師並不簡單
發佈時間:2020-04-15 11:13:51 | 來源:科技日報 | 作者: | 責任編輯:張青如今人工智慧在各領域大顯身手。尤其在電商服務、票務出行、健康問診、生活購物等服務體驗端,大大提升了工作效率,這背後則離不開人工智慧訓練師的支援。日前人力資源社會保障部與國家市場監管總局、國家統計局聯合向社會發佈了16個新職業,其中就包括人工智慧訓練師。據了解,這是自2015年版《中華人民共和國職業分類大典》頒布以來發佈的第二批新職業。而最新分析顯示,預估到2022年,人工智慧訓練師國內外相關從業人數有望達到500萬。
工作主要面向産品的實際使用過程
根據人力資源社會保障部與國家市場監管總局、國家統計局聯合發佈的通知,人工智慧訓練師的定義為使用智慧訓練軟體,在人工智慧産品實際使用過程中進行數據庫管理、演算法參數設置、人機交互設計、性能測試跟蹤及其他輔助作業的人員,主要集中在新興産業和現代服務業兩個領域。
光看定義,有人可能還難以區分人工智慧訓練師和其他人工智慧開發者的區別,對此,海南省區塊鏈産業研究院專委副主任、海南大學教授段玉聰分析,從職業定義上,人工智慧訓練師主要使用智慧訓練軟體,工作面向人工智慧産品的實際使用過程。而人工智慧開發者主要使用開發類軟體,工作面向的是人工智慧産品的研發和設計階段;開發者主要完成的是功能性、系統性的工作,人工智慧訓練師的工作目標則是提升人工智慧産品的性能。
目前,人工智慧訓練師這一職業包含多個工種,不同工種的工作內容有所差異,要求的技能側重也有不同。一般來説,人工智慧訓練師主要分為數據標注員和人工智慧演算法測試員。數據標注員在不同的企業會有不同的要求。人工智慧演算法測試員則對技能要求相對較高,需要具備相關數據處理的理論基礎,熟悉相關技術方法,熟練使用開發語言與倣真測試工具並具備演算法研發或測試經驗。
人工智慧訓練師如何訓練人工智慧?段玉聰説,首先人工智慧訓練師需要對涉及的數據和知識有一定的認知,然後對數據進行“清洗”,得到結構化的核心知識和關鍵數據,指定數據標注規則,將數據“喂”給人工智慧,對其進行“調教”,不斷調整參數優化演算法,從而讓機器人更好地為人類服務。比如,通過訓練AI對情緒的理解,人工智慧可以獲取人的語音、文字中的敏感資訊,根據用戶的狀態提供個性化、人性化服務。
國內目前約50萬人從事相關崗位
“科技和生産力的提高極大地豐富了人們的日常生活,社會需求結構也隨之發生改變。”人力資源和社會保障部職業技能鑒定中心標準處處長葛恒説,人工智慧訓練師是伴隨著新興技術應用而出現的新職業,適應經濟社會發展需要,滿足人們不斷提升的需求,順應新産業、新業態、新模式的發展變化趨勢。
行業發展交叉領域催生出的新型職業和新型崗位,讓人工智慧訓練師市場的需求不斷增長。“現在全世界都在促進人工智慧技術的研發,人工智慧已經滲透到很多行業,比如:數據分析、製造、教育、安防、市政、物流、人機交互、交通等。而這些新的交叉行業,都需要人才來參與實現,所以人工智慧訓練師對於當前社會來説,需求度是很高的。”海南師範大學副教授鄧正傑説。
阿里巴巴集團客戶體驗事業群人工智慧訓練專家王智宇在接受媒體採訪時表示,阿裏從2015年開始孵化國內第一批的人工智慧訓練師,目前整個阿里巴巴生態中有20萬名人工智慧訓練師,經過阿裏人工智慧訓練體系培養並獲得認證的有近6萬人。
王智宇提到,除了阿里巴巴這樣的電商服務集團,國內大大小小的AI公司基本都有自己的人工智慧訓練師。“整個行業涉及到AI的公司,無論甲方乙方,技術公司或者服務型公司,其實都在開始培養自己的人工智慧訓練師,這也是與以前不一樣的一點。”他透露,國內大概有50萬人去從事這樣的崗位。
數據分析顯示,按照目前的行業發展速度,應用領域的拓展情況,數據標注員等短期內仍會存在較大的人才缺口;而隨著技術的發展對從業人員素質的要求也在不斷提高,人工智慧演算法測試員等技術性人才缺口將更加突出。
新型落地場景要求提升綜合素質
“我們每天要將成百上千幅照片裏的物體分門別類地圈出,再標注出來,比如花盆、地毯、茶几、沙發……這些標好的圖片會被送進數據庫,成為人工智慧的學習素材。比如,當電腦看了幾萬個標注沙發的物體之後,它才能認識什麼是沙發。”貴州小夥子小陳描述自己的工作。
“對我們來講,AI訓練師最大的挑戰是跨界融合,這需要訓練師既懂法律知識又懂演算法相關知識。”北京智慧正安公司公司CEO李正才表示,我們對應聘者的要求主要是搭起AI工程師和數據標注員之間的橋梁。
雖然各人才需求方對於人工智慧訓練師的要求各不同,但不難看出,目前人工智慧訓練師的主要工作任務不僅包括標注和加工圖片、文字、語音等業務,還包括分析提煉專業領域特徵,訓練和評測人工智慧産品相關演算法、功能和性能,設計人工智慧産品的交互流程和應用解決方案,監控、分析、管理人工智慧産品應用數據,調整、優化人工智慧産品參數和配置等。
段玉聰認為,目前,人工智慧訓練師中,從事數據標注等簡單任務的人員確實佔比較高。但是,隨著人工智慧的強化學習等具有無監督自我學習演算法的興起,對於數據的依賴性將減輕,人工智慧訓練師的工作重點也將發生變化。另外,今後如要對面向具有精神需求的繪畫、音樂、文學等應用場景開發數據訓練人工智慧,人工智慧訓練師更需要不斷學習和提升綜合素質。
面向人類情感等主觀感受方面的人工智慧標注應用前景巨大。段玉聰建議,對有關人類精神世界的挖掘,相關部門應從人工智慧治理進行立法和立標等角度,對人工智慧訓練師職業道德做好提前鋪墊。
對於如何更好地做好職業規劃,首都科技領軍人才、清華大學電子工程系博士謝耘提出了更高的要求。他説,人工智慧訓練師最重要的是要把方法搞透,不同的方法原理,適用於不同類型的問題,人工智慧訓練師要系統地積累經驗,把感性經驗總結為理性的認識,不斷地持續練習,要按照工匠的標準去要求自己。但是,人工智慧訓練師不應僅僅局限于工匠格局,應通過經驗摸索,進一步總結出更深一層的原理,創造普適性的成果。