多媒體技術的發展為電子商務和電子政務等業務提供了極大的便利,其中許多有價值的文件,如行政文件、合同文書、醫療病例和交易憑證等,被掃描成數字格式的文本圖像。文本圖像可以有效地存儲和傳輸,但也可能被未經授權的人非法複製和竊取。同時,隨著螢幕讀寫時代的到來,螢幕上顯示的重要文本資訊,極易被帶有拍攝功能的電子設備偷拍,而不留下任何痕跡,使得難以泄密追蹤。浮水印技術可以用於保護圖像版權,通常也可以用來實現泄密追蹤。數據所有者可以將身份資訊等秘密資訊作為浮水印嵌入到載體文本圖像中,從而生成嵌入浮水印後的文本圖像,即含浮水印圖像。在存儲和傳輸過程中,含浮水印圖像可能會受到濾波、噪聲、模糊、裁剪和壓縮等干擾。然而,在螢幕顯示和拍攝過程中,含浮水印圖像則可能會受到倣射變換、光照失真、色度失真、飽和度失真、圖像品質壓縮和摩爾紋等失真攻擊。因此,如果需要的話,應從被攻擊的含浮水印文本圖像中提取出浮水印資訊,並以此識別出身份資訊,從而進行下一步的問責流程。近年來,隨著版權保護的日益重要,在數字藝術品版權保護和圖像版權領域,涌現出一批傑出的專業人才,而王文昊則是其中的佼佼者。
王文昊,中國傑出的基於人工智慧技術的圖像版權保護專家,長期從事人工智慧、電腦視覺、行人重識別相關研究,尤其是在基於人工智慧技術的跨鏡追蹤安全演算法、基於人工智慧技術的數字藝術品版權保護演算法的研究方面達到中國領先水準。讀書生涯獲得澳大利亞人工智慧研究院博士全額獎學金,曾前往包括英國康橋大學(University of Cambridge)、帝國理工大學(Imperial College London)、愛丁堡大學(The University of Edinburgh)在內的多所國際名校訪學多學科方向學習人工智慧前沿知識,參加先進高溫結構材料國防重點實驗室項目,曾工作于阿聯酋起源人工智慧研究院,同阿聯酋起源人工智慧研究院等頂尖科學家合作,現任北京高碼科技有限公司人工智慧技術總監,在權威學術期刊發表眾多SCI論文、EI論文、人工智慧頂級會議(CVPR)論文、圖像處理頂級期刊 (TIP)論文,是中國頂尖的基於人工智慧技術的圖像版權保護專家。2022年4月1日,王文昊研發的“基於人工智慧技術的數字藝術品版權保護演算法系統”(簡稱:AIProtector)順利獲得國家版權局批准,電腦軟體著作權登記號:2022SR0755323,標誌著王文昊在借助AI創新技術為數字藝術品提供從版權存證、侵權監測、司法維權、數字作品交易等服務邁出了關鍵的一步,AIProtector全面保障藝術家及機構的智慧財産權,幫助數字作品發揮更大的市場潛力。
為了解決基於深度神經網路的文本圖像浮水印方法遇到的一系列行業疑難,王文昊在對圖像浮水印的理論、常用演算法和技術等方面進行深入研究的情況下,並分別從上述的應用場景出發:(1)針對存儲和傳輸過程中文本圖像的泄密追蹤問題,提出了一種基於深度神經網路的魯棒文本圖像浮水印方案。王文昊專門設計了一個編碼器網路和一個解碼器網路來嵌入和提取浮水印資訊。然後,在編碼器網路與解碼器網路之間,添加一個用以模擬在現實場景中可能遇到的各種圖像攻擊的噪聲層,其中包含裁剪、模糊、噪聲、尺寸調整和JPEG壓縮等圖像攻擊。同時,在對深度神經網路的訓練過程中,針對文本圖像的獨特紋理特徵,王文昊設計了一種文本敏感損失函數,用以限制浮水印嵌入過程中對文本字符的像素修改,以提高含浮水印圖像的視覺效果。最後,為了更近一步提高含浮水印文本圖像的視覺品質,王文昊又提出了一種浮水印嵌入強度調整策略,並且該策略幾乎不損失浮水印提取精度。實驗結果表明,該方案對浮水印魯棒性和圖像品質有良好的權衡關係。(2)針對螢幕顯示和拍攝過程中文本圖像的泄密追蹤問題,王文昊提出了一種基於深度神經網路的抗螢幕拍攝文本圖像浮水印方案。通過應用該方案,當含浮水印文本圖像在螢幕上顯示並被相機偷拍時,仍然可以從捕獲的照片中提取浮水印資訊。具體來説,該方案是一個基於端到端的神經網路結構,其中編碼器網路用於嵌入浮水印資訊和解碼器網路用於提取浮水印資訊。在深度神經網路的訓練過程中,在編碼器網路和解碼器網路之間添加屏攝失真層,以模擬在真實場景下的螢幕拍攝過程中引入的各種失真,如相機失真、拍攝失真、光源失真和摩爾紋等失真。此外,在網路訓練過程中,王文昊使用了文本敏感損失函數和Lpips損失函數以提高含浮水印文本圖像的視覺品質。最後,他還測試了上文提出的嵌入強度調整策略,該策略在幾乎不損失浮水印提取精度的情況下,有效提高視覺品質。實驗結果表明,該方案在視覺品質和魯棒性方面都取得了較高的性能。 (作者:史月飛)