聖奧舉辦首屆“球王PK賽”豐富員工業餘生活 | 2024數字中國建設峰會:華為雲助力徐州市城管局榮獲數字城市賽道“百景新銳獎” | 專注數字內容風控,網易易盾安全大模型正式亮相 | 超強性能!LALO磁吸閃刷隱形支架讓出行更便捷! | 中國在生成式人工智慧應用領域佔據領先地位 | 機械行業提升,推動創新發展 | 五福堂國醫館慢病管理啟動會在山東青州成功舉辦 | 2024懂車帝夏測賽道圈速測試結果出爐,領克08 EM-P獲得SUV車型第一名 | TATA木門發佈空間定制戰略,立足木門品類開拓“門的三次方” | 賦能醫美健康 助力醫美行業蓬勃發展 |
 
當前位置: 新聞>滾動>

專注數字內容風控,網易易盾安全大模型正式亮相

發佈時間:2024-07-11 16:54:16  |  來源:河北網路電視臺  |  作者:  |  責任編輯:科學頻道

7月6日,以“智見未來,護航AI”為主題的2024網易易盾AI數字內容風控大會在杭州順利舉行。會上,網易數智旗下網易易盾正式發佈面向數字內容風控領域的安全大模型。

"安全是一個需要抬頭創新、低頭深耕的行業。數字內容風控這個網路安全領域內的細分賽道正在蓬勃發展,這次安全大模型的發佈是我們多年來技術和經驗沉澱的‘集大成時刻’。”網易數智副總經理、網易易盾總經理朱浩齊在大會上帶來網易易盾自研安全大模型的首次正式亮相。

七年磨一劍:為安全範式轉變做準備

在社會學著作《理解媒介》中,思想家麥克盧漢曾深刻、具體地揭示了媒介的影響力。

按照麥克盧漢的理論,媒介資訊在很大程度上影響人間事物的尺度變化和模式變化,塑造人的組合方式和形態。因此,媒體是導致社會變動的最強大力量之一。從報紙到電視廣播,再到網路傳媒與數字時代的新媒體,作為資訊和內容的載體,媒介方式隨著技術變革在不斷進化。與此同時,麥克盧漢的理論在逐步得到證實。

數字內容的安全問題不僅沒有隨著技術進步消除,相反,對社會的影響正在逐年上升。

“我們在經歷一場底層安全範式的轉變。資訊傳播技術的進步把內容安全問題的重要性升級了,需求端從原先的附加安全發生了到內生安全這一模式轉變。作為服務者,我們不僅需要從理論、技術和工具上做準備,更需要從思維上主動擁抱變革。”朱浩齊在大會上説。

如今,人工智慧技術的發展與應用極大地提升了內容生産的效率和品質。通過自然語言處理(NLP)、機器學習、圖像識別等技術,人工智慧可以幫助企業自動化地生成文章、視頻、圖像等內容,甚至進行個性化推薦和優化,滿足用戶的多樣化需求。誠然,AIGC為企業與社會帶來內容生産力的成倍增長,但也再次放大數字內容安全的重要性。

從最開始服務於網易內部業務的安全部門到服務外部客戶的完全商業化品牌,網易易盾既有天然的技術優勢,又有豐富的的場景實踐經驗。

同時,多年內外部客戶的持續服務也讓網易易盾擁有了成熟的技術、産品與服務體系。網易易盾面向娛樂社交、遊戲、電商、金融、零售、政企等多個行業相繼推出了解決方案,同時秉持“助力客戶內生成長”的服務理念,持續上線AIGC內容安全、出海安全合規、未成年人網路保護等數十個場景化安全方案。

7年多的時間,網易易盾累計數據檢測量超3萬億,覆蓋終端數超32億,服務客戶審核效率提升超10倍。

網易易盾既是數字內容風控領域的頭部企業,又是AI時代的先行者。率先參與到從附加安全到內生安全的轉變,並以AI技術為安全業務賦能,給客戶提供更加專業的安全産品和服務,進而推動行業發展——這在網易易盾總經理朱浩齊看來,是義不容辭的責任,也是得天獨厚的市場先機。

因此,更懂數字內容風控的安全大模型正式發佈了。

安全大模型:聚焦數字內容風控

在數字內容安全問題治理的過程中,過去很長一段時間,更多的是憑藉經驗。

在抖音上這句話能不能發?在小紅書上這個問題能不能搜到?在微網志這個話題是否可以討論?然而落到個體對每次具體情況的理解不同,最終體現在安全風控措施的理解上也非常不同。

在網易易盾成立的初期,曾有過一次深入的討論:我們能不能基於我們對各行業實際落地的經驗,去建立各行業內容風控的標準?而在實際落地過程中,發現標準仍還是非常的粗糙,與以往並沒有根本性不同。

大模型的興起和應用,使網易易盾這個想法真正具備可行性。早在2021年,網易易盾就開始著手研究大模型相關技術,通過讓大模型學習理解不同場景下,不同內容的評判結果,讓人工智慧去建立各行各業、各個場景中內容風控的研判標準,進而完成數字內容的精細化治理。

在這樣複雜的特定場景中,通用大模型顯然並不能提供符合需求的最優解。

“數字內容風控是安全服務。安全,就要一絲一毫都不能差。我們給客戶提供的必須是我們自己都挑不出問題的完美方案。”朱浩齊講述了帶領團隊開發安全垂直大模型時的原則和思路。

在大模型的“軍備競賽”中,網易易盾雖然有“行業領軍者”的自我要求,卻不急於將不夠完美的産品推向客戶。基於自身業務的特性,從客戶的需求和實際應用場景出發,再到小心翼翼地驗證産品的每一個功能細節,直到反覆確認沒有問題,可以解決客戶的問題——網易易盾的大模型之路走的每一步都是穩字當先。

應用安全大模型的數字內容風控通過大模型對風控尺度的理解,對風險內容實現標簽的自動、精準標識,提升人工審核效率。目前,基於各種場景的測試情況,網易易盾安全大模型已經做到對部分色情疑難樣本召回提升30%以上,助力廣告對抗場景下的違法廣告識別率達到97%以上,AIGC人臉風格化疑難案例的識別率超90%。此外,該安全大模型將風險對抗的時效提升到了小時級,並且輔助真人引流團夥檢出量增長達3倍。

同時,在結合了網易易盾安全大模型的通用大模型問答場景中,基於安全大模型對用戶輸入的語義理解和對風控規則的理解,能夠幫助各類通用大模型對於一些“看上去不好答”的題目,給予準確的回答。除少數幾個極度敏感的議題外,幫助提供開放式問答的模型能夠快速做到“應答盡答”。

以“模”治“模”:AI時代的長遠藍圖

生成式人工智慧的發展始終伴隨著對安全的質疑。

自ChatGPT引爆人工智慧浪潮熱點後,世界各國紛紛緊急將生成式人工智慧的安全管控上升至重要緊急議題。我國為了促進生成式人工智慧健康發展和規範應用,發佈《生成式人工智慧服務管理暫行辦法》,歐盟理事會批准全球首部對人工智慧進行全面監管的《人工智慧法案》,美國發佈一項名為關於安全、可靠和值得信賴的人工智慧(AI)的相關行政令。

綜合世界各國政府部門與頂級智庫對於人工智慧安全問題的判斷來看,大模型時代的安全面臨突出的問題在於數據安全、內容安全,其中包括業務安全、供應鏈安全、合規以及道德倫理風險。

其中,在當下以及未來很長一段時間內,內容安全問題會一直是人工智慧治理的關鍵挑戰。社會需要關注的是大模型生成,如AI換臉的虛假違規內容被利用為作惡工具,以及幻覺問題、知識模糊、不實新聞等。

“對人工智慧的治理,長期來看,也許需要靠另一個人工智慧了。”朱浩齊表達了對AI時代內容安全問題治理趨勢的判斷,“人工智慧給數字內容生産和傳播效率帶來的是幾何倍數級別的增長,對於安全治理的能力提升要求自然也只有人工智慧才能滿足。”

安全,不是一朝一夕的事情。尤其是全新技術帶來的既有“已知的未知”安全問題,也有“未知的未知”安全問題。為了解決各種“已知的未知”和“未知的未知”安全問題,網易易盾在大模型的研發思路中應用了新設計的防禦理論:內生的彈性縱深防禦體系。這個體系中有兩個最重要的設計原則:

一是用時間換精度。這個原則中考慮的並非某個時間點下系統的靜態防禦能力,而是需要評估在持續的攻擊之下系統的自我升級能力,其稱之為“自免疫力”。

二是用不確定性提升防禦強度。在測試數據變化的情況下,該原則要求通過提升自我保護能力實現系統對多次攻擊的穩定防禦。

用大模型治理大模型的數字內容安全,用人工智慧對抗人工智慧帶來的安全風險。這是網易易盾對未來趨勢的判斷,也是網易易盾正在走的安全技術長征。