人工智慧翻譯助力網文“一鍵出海”

發佈時間：2024-01-08 09:44:57 | 來源：光明日報 | 作者：劉江偉 | 責任編輯：孫靈萱

“土生土長”的中國網路文學已成為世界文化奇觀。根據中國作協發佈的相關數據，海外用戶超過1.5億人，覆蓋200多個國家和地區。

海外閱讀需求旺盛，但相較堪稱海量的中國網路文學而言，“出海”作品仍是少數。中國網文“出海”至今，累計輸出作品16000余部，而僅2022年，國內新增作品就有300多萬部。每天有百萬海外讀者盯著螢幕、線上“催更”，“出海”作品“供不應求”。

翻譯是第一道關卡。篇幅巨大、作品海量，而翻譯人才不足，成為影響網路文學更大規模走出去的重要因素。

近年來，人工智慧（AI）為網文“出海”打開了一扇窗。日前，在第二屆上海國際網路文學周上發佈的《2023中國網路文學出海趨勢報告》顯示，截至2023年10月，閱文集團旗下海外門戶起點國際已上線約3600部翻譯作品，同比三年前增長110%。在人工智慧的助力下，網文的翻譯效率提升近百倍，成本降低超九成。

AI正推動網文規模化“出海”，讓“一鍵出海”“全球追更”成為可能。

翻譯效率提高3600倍，成本降到人工翻譯的1%

中文翻譯本來就難，文學翻譯更難。“信達雅”是文學翻譯的基本標準，網路文學翻譯也不例外。

在中國社科院研究員陳定家看來，網文在翻譯上要儘量滿足三個標準：準確性、流暢性、藝術性，“網路文學的翻譯應該盡可能準確地傳達原文的意思，包括各種語義、文化和情感內涵。譯者應該具有良好的語言表達能力，使譯文在目標語言中能被自然流暢地閱讀”。

北京大學中國語言文學系博士研究生雷寧觀察到，對北美受眾而言，太極、功夫、龍等中國元素並不陌生。然而好萊塢大片式的文化傳播與網文翻譯的本質區別在於，前者多用文化符號拼貼的方式打造“中國印象”，難以擺脫隔岸觀火的獵奇目光，後者是愛好者主動進行的文化交流行為，借由逐字逐句的翻譯來更深入地傳導文化。這無疑對譯者有很高的要求。

更新效率又關乎用戶的黏度。根據艾瑞諮詢發佈的《2019年中國網路文學出海報告》，影響海外網文用戶體驗的最主要因素是網文“出海”的效率。超八成的用戶會把“作品更新穩定，題材多樣”作為選擇平臺的第一要素，他們常遇到的問題是“正在更新的小説更新太慢和突然停更”，“想看的小説沒人翻譯”。

翻譯難度大，成本也高。有業內人士表示，網路文學請專業譯者翻譯的價格，基本是每1000字200元的報酬。而作品動輒幾百萬字，成本何其之高。即使這樣，對優秀的翻譯人才來説，也不具備吸引力，他們更願意做同聲傳譯或者金融、法律、醫療等領域的翻譯。

技術革新開闢了一條新路。2018年，國內自主研發的首個網路文學人工智慧翻譯系統推出並應用，大大提升了翻譯效率和作品“出海”數量。推文科技創始人童曄算了筆賬，AI能使翻譯效率提高3600倍。具體來説，對於1000字的翻譯，人工需要1小時，AI只需要1秒；成本也降低到原來的1%，100萬字的專業譯者翻譯需要20萬元，AI只需要不到1000元。

中國音像與數字出版協會副秘書長李弘表示，目前，我們已經可以借助AI將網文翻譯為英語、西班牙語、印尼語、葡萄牙語、德語、法語、日語等多種語言，不僅中國網文從中受益，海外原創網文也有了更大的傳播空間。

人工智慧翻譯可以達到“理解上下文”的程度

人工智慧翻譯準不準呢？童曄給出直觀答案：“100分的滿分，專業譯者可以拿到85分，AI翻譯可以拿到75～80分。”

“比方説，翻譯口語中的‘梗’，人工智慧之前不行，現在可以了。”童曄説，人工智慧先把“梗”變成平鋪直敘的語言，再從目標語言中尋找一種相應的“梗”，這更符合“信達雅”的翻譯要求。

精確度如何實現的呢？一些網文平臺發佈的資料顯示，正如人類翻譯受自身知識面的限制一樣，AI模型達到的能力範圍也受到語料範圍的限制，所以要盡可能豐富地給AI“喂料”。平臺基於自然語言理解技術，對網文內容進行深入挖掘。通過對大量網文內容和優質社區內容的標注和識別，使機器更好地理解網文內容。比如，AI可以自動識別角色、場景、題材、故事脈絡等資訊，構建網文的整體知識圖譜。目前，AI翻譯能夠較好地翻譯網文特殊領域中的詞、句、段落，包括人名、地名以及類似“金丹”“解藥”這種特有元素詞，還能識別出各種代詞指代的對象，盡可能避免傳統機譯中“一詞多譯”“張冠李戴”等現象。

彩雲科技CEO袁行遠解釋説，人工智慧在翻譯時，會從原文中提取出人物並判斷其性別。它在判斷什麼詞是人名時，會依據一些語法規則，例如“××説”，“説”字前的名詞一般是一個人。利用類似的方式，人工智慧就能獲得一張專有詞表，使得翻譯工作得以順利推進。另一方面，過去常見的“逐句翻譯”常常忽略語境，導致翻譯結果僵硬、不知所云，而目前的機器翻譯已經發展到“理解上下文”的程度。

不過，這只是技術上的進步，精準翻譯具備了可能性，還無法進行規模化應用。業內人士指出，比較淺白的表述，AI可以“猜”出正確的翻譯，但遇到比較迂迴的表述，比如語料中從未出現過的成語，AI猜錯的可能性就會變大。例如，“燃燈如豆”可能被直譯成“火焰像豆子”，機器無法理解深層的內涵。同時，它也不能理解故事的複雜邏輯，無法判斷前面一個伏筆會成為故事後面至關重要的因素，這都是尚需進一步探索的課題。

人工智慧翻譯還離不開人的“精加工”

是否使用人工智慧翻譯，不同的作家學者也有不同的理解。

人工智慧追求效率提升的同時，難免會丟失文本品質、消損原著色澤。首都師範大學教授許苗苗觀察到，對於熱愛寫情節、開腦洞，不太在意風格的作者，特別是那些熱愛IP轉化，從文字作者變成編劇的作者來説，機器翻譯不成問題，而對於鍾愛自己語言風格的作者來説是致命的，“這樣的翻譯缺乏獨特性，翻譯出來的文本只是內容而非風格”。

地域特色翻譯、本土語境表達仍是很多作家關注的問題。陳定家指出，在翻譯的過程中，基於海量資訊的大型語言處理機器，難以處理一些複雜的語言現象，如文化差異、本土語境等，只能嚴格遵守語法規則與句式結構，無法準確傳達作者的審美趣味與情感追求，導致扁平化的翻譯結果。

閱文集團副總裁、總編輯楊晨也把術語翻譯的準確性作為AI翻譯的首要挑戰，“像人物稱謂、門派、功法、修煉等中國網文、中國文化中特有的語言術語和表達方式，單純依靠AI翻譯無法準確表達其內涵”。

目前，人工智慧翻譯還離不開人的“精加工”。中南大學教授歐陽友權認為，“人—機”協作才能保證品質。因為受目前技術水準所限，人工智慧翻譯的缺點是明顯的，但“機譯”的發展方向是對的，當弱人工智慧升級為強人工智慧時，也許這個問題就解決了。

艾瑞諮詢發佈的《2021年中國網路文學出海研究報告》指出，現階段，通過出海服務商為內容平臺提供優質的AI翻譯，加上後期的專業譯者校對潤色，優勢互補，正在幫助網路文學快速規模化出海，特別是在2020年多語種市場佈局加速的背景下，人工智慧翻譯的應用能夠幫助企業快速實現語言的遷移。

楊晨表示，閱文集團組織了超過3萬人次的讀者測試及反饋，對AI翻譯的細節進行不斷地微調，使翻譯更貼近海外讀者的閱讀習慣。網文平臺需要重建網文翻譯的流程和體系，搭配人工校正來綜合優化AI翻譯內容。

（劉江偉）