激活中華典籍的“數字生命”
——對我國古籍數字化建設的調查與思考
作者:光明日報聯合調研組(執筆人:北京市習近平新時代中國特色社會主義思想研究中心特約研究員吳佔勇、本報記者白雪蕾;調研組其他成員:中央民族大學新聞與傳播學院張亞文、張志穎)
編者按
我國古代典籍卷帙浩繁,見證著中華民族悠久的歷史,是中華文化的重要載體。2023年10月,習近平總書記對宣傳思想文化工作作出重要指示,明確提出要“著力賡續中華文脈、推動中華優秀傳統文化創造性轉化和創新性發展”。2022年4月,中共中央辦公廳、國務院辦公廳印發《關於推進新時代古籍工作的意見》,明確提出“推進古籍數字化”。同年10月,全國古籍整理出版規劃領導小組印發《2021—2035年國家古籍工作規劃》,將“國家古籍數字化工程”列為四項重大工程之一,對相關工作進行詳細規劃。那麼,當前我國古籍數字化的建設狀況如何?産生了哪些大眾喜聞樂見的案例?未來又該如何優化發展?圍繞上述問題,光明日報記者會同中央民族大學組成聯合調研組,對參與古籍數字化建設與傳播工作的圖書館、科研院校、網際網路企業、出版單位等工作人員開展深度訪談,並對文化類數字産品的活躍用戶—青年群體進行問卷調查(有效問卷689份),在系統梳理古籍數字化建設經驗的基礎上,針對其高品質發展提出對策建議。
輕點滑鼠,隨著一縷悠遠的音樂,“永樂大典”在雋秀的書法背景中緩緩浮現……
“終於讓我們普通讀者一睹國寶真容。”家住山東滕州的古籍愛好者李慶,在電腦螢幕前瀏覽《永樂大典》數字版時發出感嘆。他所觀看的,是由國家圖書館出版社有限公司和北京大學-字節跳動數字人文開放實驗室聯合研發的“《永樂大典》高清影像數據庫”。歷經600多年風雨,成書于明朝的《永樂大典》存世數量不及原書的4%,眼前的影像數據庫讓每一位讀者都能感受它的厚重與魅力。
保護和傳承中華古籍不僅是維護中華文明根基的重要任務,更是向世界傳播中華文化智慧、造就中華文明新形態的關鍵環節。在學術意義上,古籍數字化意味著運用數字技術對古籍進行收藏與保護、整理與研究、呈現與出版,而在更廣闊的人類文明衍進層面,數字化使古籍中的智慧精華,能夠通過趣味性、前沿性和大眾化的方式,得到傳播與推廣。調研中,98%的受訪者認為應對古籍進行數字化轉化,幾乎相同比例的人認為數字技術對古籍保護和傳承發揮著顯著作用。
煥新 以數字科技賡續中華文脈
古籍保護層面,數字化實現古籍生命永久存續,助力海外遺珍重現容顏。
中華文明是世界上唯一沒有中斷的文明,在數千年曆史進程中,傳世古籍浩如煙海。古籍不僅包含傳統線裝古籍,還包括甲骨、簡帛、碑帖拓本、古地圖等。《中國古籍總目》顯示,我國現存古籍約有20萬種。數字科技從根本上改變了古籍保護邏輯,通過“數字孿生”和“入庫共用”,使古籍以數字形態永久保存。
“古籍數字化關係到我們國家文化資源的安全。古籍一旦遇到火災、水災等,將帶來不可逆的損壞”,國家圖書館(國家古籍保護中心)辦公室介紹。由國家圖書館(國家古籍保護中心)建設的“中華古籍資源庫”,目前已發佈古籍資源10.3萬部(件),共2640萬頁,其中,讀者利用率最高的善本古籍,已有2萬多部實現上網。
對於壁畫、彩塑等無法永久傳世的文化形態,數字復刻更為重要。敦煌研究院的“數字敦煌”項目,將洞窟、壁畫等製作成數字圖像,一方面能永久保存敦煌文化資訊,另一方面可使遊客將線上參觀與實地遊覽相結合,降低過量遊客進入洞窟帶來的文物保護壓力。
除了在時間維度上永久延續古籍生命,數字技術還打破空間限制,使散佈于國外的中華古籍能夠以數字方式重現真顏。公開資料顯示,由山東大學作為主體單位實施的“全球漢籍合璧工程”,對境外存藏的中華古籍進行調查摸底和數字化回引,至2023年7月,已經發現1900多種中國大陸缺藏的珍稀漢籍,並複製回歸1600余種。
古籍整理層面,數字化推動古籍搭上智慧“快車”,促進整理工作提質增效。
在影像復刻基礎上,運用人工智慧技術對古籍文本進行提取、標引、分析等,是數字科技助力古籍傳承的關鍵一環。北京大學數字人文研究中心主任王軍曾指出,依照國內修復整理古籍的速度,可能需要300年才能將現存古籍全部修復整理出來,但借助人工智慧技術,這一時間大概會縮短至二三十年。
“古籍的數字化整理部分,我們從人力和資金的投入上來説是比較多的”,字節跳動公益古籍項目相關負責人告訴調研組。由於數字化整理需要把紙本內容轉化成數字文檔,古籍特有的假體字、異體字和書寫方式等,對轉化準確率形成挑戰。在文本提取基礎上,自動斷句、自動標點以及識別文本中的人名、地名、官職名等,更體現著智慧科技對古籍整理工作的顛覆式迭代。
當然,機器無法百分百準確地識別語義,人工標注和校對依然重要。借助數字平臺,古籍整理的眾包模式悄然興起。中華書局下屬的古聯公司在2018年推出古籍整理眾包平臺,2020年上線了能在移動端分發任務的“i編纂”小程式。公司總經理洪濤向調研組介紹:“眾包平臺有5000多位註冊用戶,他們是來自各行各業的古籍愛好者。”據悉,該平臺上編校過的任務近5萬個,處理的古籍超14億字。
古籍傳播層面,數字化推動“蒙塵”古籍走向前臺,搭載網際網路實現開放共用。
小譚是中國古典文獻學專業的在讀研究生,日常學習“穿梭”于各大古籍網路平臺。“這些平臺基本能滿足對材料的初步檢索蒐集,許多平臺還提供珍貴古籍書影數據,不用去各地奔波就能看到古籍原貌。”
點開國家圖書館(國家古籍保護中心)建設的“中華古籍資源庫”,排列著數字古籍、數字方志、趙城金藏、碑帖菁華、甲骨世界等20余個子欄目,支援單庫檢索、多庫檢索、精確檢索、模糊檢索。由北京大學-字節跳動數字人文開放實驗室打造的“識典古籍”平臺,提供原本影像對照、繁簡轉換、文白翻譯等功能,並對內容添加了標點和注疏,還能顯示文中人名、地名、書名等專有名詞詳細介紹。據調查,超過80%的受訪者期待使用集搜索、翻譯、註釋等功能于一體的古籍應用平臺,這些功能使古文褪去晦澀難懂的外殼,極大方便用戶閱讀和學習。
分佈于全國各地的珍貴古籍也借助數字化浪潮紛紛亮相。截至2023年9月,國家圖書館(國家古籍保護中心)聯合各地圖書單位開展了8次古籍數字資源發佈活動,地方圖書單位累計發佈古籍資源超過2.8萬部(件),參與發佈的機構下沉至縣級圖書館。針對全省各地市館不少珍貴古籍已做數字化處理但未能發佈的情況,浙江圖書館建立了“浙江省歷史文獻數字資源總庫”,已發佈古籍2600余種,約6.5萬餘卷。聯合發佈讓散佈于中華大地的珍貴古籍重煥光彩。
活化 融古於今繪就現代文明
內容的活化:萃取海量古籍中的知識網路
將海量古籍文本進行數字化提取,就形成了匯聚先哲智慧的“大數據庫”。借助智慧分析技術,能夠針對其開展深度文本挖掘、社會網路分析、時空關係分析、知識圖譜建構等,讓大眾全面又直觀地理解古籍中的知識網路。
浙江大學徐永明教授團隊開發的“智慧古籍平臺”,在提供文本分詞、標注、釋義、文白翻譯等功能基礎上,還為用戶呈現古籍著者的世系圖、社會關係圖等。“未來的發展方向,是將古籍文本與結構化數據進行關聯,實現智慧化處理”,徐永明教授告訴調研組,他的團隊還開發了學術地圖發佈平臺,以地理資訊系統為依託顯示其規律性、綜合性數據,比如李白、杜甫一生中的地理遷徙軌跡圖等,這一平臺在中學語文教學中得到廣泛應用。
對古籍文本知識進行顯性化提取,也是北京大學數字人文研究中心持續發力之事。近期該中心上線“文獻溯源分析平臺”,能夠呈現詞語在古籍文本中的出現頻次、共現情況等,並可追溯句子的來龍去脈,觀察句意相似句子在形式和內涵上的流變過程。“吸引大眾參與是古籍活化的重點,要利用智慧技術讓社會更多接觸和使用古籍數據”,中心研究員位通談到。在北京大學2022年舉辦的首屆“北京大學數字人文作品展”中,“中國古代名人遷居地圖”“中國古典詩歌聲律分析系統”等也令人印象深刻。
形態的活化:虛擬倣真推動古籍融入現代生活
“千年之後,還有這麼多人喜歡我,我還是蠻欣慰的”,在2023年央視《中國詩詞大會》現場,詩人蘇軾“穿越”而來,不僅為選手出題,還與演員飾演的黃庭堅一起再現了“鄱陽湖相會”。這位“蘇軾先生”讓人難辨真假,而“他”正是當下火熱的虛擬數字人。
再如,深度沉浸的超現實技術將古籍活化推向新高度。2023年在國家典籍博物館舉辦的“古籍尋遊記”體驗項目引發熱烈追捧,觀眾只需頭戴虛擬現實頭盔,手持操作手柄,便能夠“親身”穿梭于歷史時空,“親手”將文物捧在掌心。
在技術加持下,虛擬現實、沉浸參與、人機交互、智慧傳播等為文化創新持續賦能。從“閱讀古籍”到“身臨其境”,技術重構了人與古籍的互動場景,讓人能在綜合感官體驗中領略文化魅力,提升對文化的歸屬感和認同感。
此外,網路遊戲、數字展廳、數字藏品等當下流行的傳播形式,在多個維度上助力古籍從“活”起來到“潮”起來。
體驗的活化:借助數字影像講好古籍故事
古籍不僅蘊含古人智慧,也承載著中華文明發展的集體記憶。傳播經典古籍,要將古籍知識與古籍歷史相結合,運用具象化、生動化的手法講好古籍故事。近年來,《典籍裏的中國》《山海奇幻夜》《穿越時空的古籍》等視聽節目,不斷創新古籍影像敘事策略,引發一輪又一輪“古籍熱”。更為重要的是,這些節目注重在時空交融中詮釋中華古籍的當代價值。
“一直説‘古’會陷入曲高和寡,一定要汲取古籍對當下有指導意義、能夠産生共鳴的點。”《山海奇幻夜》總導演雪芬向調研組介紹,“比如我們把夸父追日詮釋為奔跑在路上的執著,將飛走的神鳥演繹為追求光明,這都能與現實呼應。”
短視頻平臺上,古籍的能見度也越來越高。抖音平臺#尋找古籍守護人#話題播放超過25億次,快手平臺#古籍古書#話題播放3億多次,古籍專家、普通用戶和文化機構等講述各自故事,讓古籍及其文化通過手機螢幕進一步走進大眾生活。
反思 古籍數字化還需要完善什麼
建設主體各自為政,技術標準不統一,數據庫之間壁壘明顯。當前,全國範圍內的古籍數據庫,在建設中缺少統一的技術規範,古籍的呈現、標注、檢索等“千庫千樣”,品質參差不齊。隨著數字化平臺增多,庫與庫之間的壁壘愈加顯現,用戶難以實現“一站式檢索”。面對海量古籍,對哪些書目進行數字化處理,各個建設單位缺少協同。“因沒有相對可持續的規劃,有較多重復製作,造成浪費”,某省級圖書館管理人員向調研組坦陳。
行業開放程度不足,版權保護不健全,制約古籍的全社會共用。古籍是屬於全社會的文化遺産,部分圖書館抱有“奇貨可居”的思想,共用意識不足。古籍館藏量僅次於公共圖書館的高校圖書館,長期定位於服務本校師生,向全社會開放程度不夠。同時,古籍數字化建設的版權保護體系尚未形成,削弱了圖書機構數據庫建設的主觀動力。“我們做數字化工作,最擔心的是出現盜印、非法牟利等現象”,廣東省立中山圖書館工作人員告訴調研組。
古籍活化系統性弱,資源配置待完善,“數字高閣”隱憂凸顯。在古籍數字化建設目標上,多位受訪專家表示,結構化、智慧化開發古籍數據更為重要,但目前國內在這一層面“只見樹木,未見森林”。從事古籍活化的主體數量較少、力量分散、單兵作戰,在人力、財力和技術上面臨制約。部分數字影像內容,將古籍元素作為噱頭謀取利益,缺乏真正的文化傳播意識,而與之形成對比的是,73%的受訪者認為古籍數字化産品的宣傳推廣不充分。長此以往,古代典籍難免會被置於“數字高閣”。
古籍活化內容單一,集中于文史題材,更多古代智慧亟待呈現。在活化産品層面,65%的受訪者認為産品形式相對單一,57%的受訪者認為內容活化程度不夠。在活化對象上,當前的數字産品通常聚焦文學和歷史題材內容,對於中醫、數學、生物、天文等自然科學領域古籍呈現較少。不少經典文學巨著已得到不同建設單位反覆深度開發,但輝煌燦爛的古代科技發展圖景,尚未進行有效的數字化呈現。如何克服技術難關,活化更多題材中華典籍,是未來建設不可忽視的問題。
展望 我國古籍數字化工作高品質發展的策略建議
加強統籌規劃,推進行業主體協同建設,助力中華古籍高效數字化傳播。當前全國尚有大量古籍未被數字化,應制定出臺古籍數字化建設統一標準,在元數據規範、技術選型、平臺功能等方面進行系統規劃。加強各類圖書館、網際網路企業、出版社等在古籍數字化建設中的聯通渠道和共用機制,編制全國性古籍館藏聯合目錄以及數字化古籍聯合目錄,打造一體化檢索平臺。完善古籍數字化建設版權保護,分析制定針對古籍整理、技術開發、活化設計等不同環節的版權認定與保護細則,規範行業與市場發展。
完善頂層設計,佈局數字人文戰略方向,引領文化軟實力建設國際前沿。社會各界應充分認識古籍活化在當代文化傳承中的重要作用,大力推進人工智慧、大數據、雲計算、可視化等技術融入古籍工作。針對前沿技術創新需求,發揮高水準企業和科研院所技術研發優勢,破解技術創新難題。將全局規劃與重點支援相結合,打造一批高品質古籍類數字人文産品。積極引領世界數字人文發展前沿,加強對外合作交流,向世界宣傳推介我國古籍數字化建設成果,增強我國文化軟實力和中華文化國際影響力。
堅守傳承導向,豐富古籍活化産品層次,滿足大眾的文化精品閱聽需求。68%的受訪者願意為古籍數字化産品付費,46%的受訪者會出於體驗新奇技術的目的使用古籍活化産品。應積極利用前沿數字科技和交互傳播技術開發古籍活化産品,滿足受眾對傳統文化體驗和參與的多重需求。打造古籍産品IP,開發適配網路空間和現實世界多重場景的系列産品,在展覽、文旅、科普、出版等事業方面積極應用。面向大視聽時代,在短視頻平臺、播客平臺和專業視聽節目中嵌入古籍産品,搭載網路超連結匯聚古籍內容,引導大眾關注古籍、傳承文化。
優化人才培養,打通專業教育與社會參與,造就數字化建設有生力量。2022年,教育部將數字人文專業列入普通高等學校本科專業目錄,但目前僅有個別高校開設此專業,應推動有條件、有基礎的高校積極佈局、開展辦學。同時,依託國家新文科和新工科建設戰略,加強資訊技術、新媒體技術、視覺設計等學科知識與古典文獻學、漢語言文學等專業交叉融合。推進高校與企業協同,在産、學、研深度融合中培育人才。面向社會開辦古籍數字化專項培訓班,統籌建設線上課程,推廣古籍整理與數字出版眾包模式,激活社會力量參與古籍數字化建設與傳播。
開展成果轉化,推動古籍數智産品進校園,以現代科技促進青少年文化傳承。中小學校是古代文化歷史教育重地,將古籍數智産品與學校教育相結合,能夠以新鮮、趣味的方式提升育人效果。教育機構與出版機構、科技企業等統籌規劃,建立面向不同學習階段的古代文化教學資源庫,推動古籍整理、智慧開發、數字出版和校園應用一體化發展。舉辦靈活多樣的古籍相關主題活動,培養青少年學習興趣,以線上線下聯通的方式推動青少年傳承中華文明。
《光明日報》(2024年01月25日 07版)
關於我們 合作推廣 聯繫電話:18901119810 010-88824959 詹先生 電子郵箱:zht@china.org.cn
版權所有 中國網際網路新聞中心 京ICP證 040089號-1 網際網路新聞資訊服務許可證 10120170004號 網路傳播視聽節目許可證號:0105123