字節跳動決定起訴此前攻擊內部大模型的前實習生。
11月28日,澎湃新聞記者獲悉,字節跳動起訴前實習生田某某篡改代碼攻擊公司內部模型訓練一案,已獲北京市海澱區人民法院正式受理。字節跳動請求法院判令田某某賠償公司侵權損失800萬元及合理支出2萬元,並公開賠禮道歉。
字節跳動內部人士向澎湃新聞記者表示,由於田某某為在讀博士,公司將其辭退後首先交由校方處理。但在事件處理期間,田某某多次對外否認,稱攻擊模型訓練任務的不是自己,而是別的實習生,甚至報警稱遭到造謠。考慮到田某某完全沒有意識到錯誤,且涉事行為已觸犯公司安全紅線,公司最終決定向法院起訴,以表明公司嚴肅態度、杜絕類似事件再次發生。
今年10月,“字節跳動大模型被實習生攻擊”一事,曾經在輿論沸沸颺颺。有傳聞稱:“字節跳動的大模型訓練被實習生入侵,注入了破壞代碼,導致其訓練成果不可靠,可能需要重新訓練。據稱遭到入侵的代碼注入了8000多張卡,帶來的損失可能超過千萬美元。”
10月19日,字節跳動回應稱:“確有商業化技術團隊實習生惡意干擾團隊研究項目的模型訓練任務,該實習生已被辭退,但這並不影響商業化的正式項目及線上業務,也不涉及字節跳動大模型等其他業務。網傳‘涉及8000多卡、損失上千萬美元’嚴重誇大。”
不過,字節跳動未披露受到影響的具體金額。字節跳動澄清,“經核實,涉事人一直在商業化技術團隊實習,並沒有AI Lab實習經歷。其社交媒體個人簡介及部分媒體報道有誤。”
該事件實際發生在今年6月底,實習生田某某為國內某高校在讀博士生,于2021年9月起在字節實習,因對團隊資源分配不滿,利用HF(huggingface)的漏洞,在公司的共用模型裏寫入破壞代碼,導致模型的訓練效果忽高忽低,無法産生預期的訓練效果,而且AML團隊無法核查原因。在消息曝出後,該名涉事實習生試圖在社交平臺上辟謠,將責任甩給他人,不過很快便遭到了接近字節跳動人士的否認。
為何索賠金額達到800萬元如此高昂?上海申倫律師事務所律師夏海龍向記者解釋稱,法庭上原告能夠證明的損失一般都會低於實際損失,判決支援的金額也一般低於原告的訴請金額。字節公司訴請索賠的金額,取決於是否有證據證明被告的確給公司造成相應損失。
(責任編輯:朱赫)