我與文化科技融合20年(3):文化和科技融合能帶來怎樣的變化?
■ 高書生
《中共中央關於制定國民經濟和社會發展第十五個五年規劃的建議》再次明確,推進文化和科技融合,推動文化建設數智化賦能、資訊化轉型,發展新型文化業態。怎麼推進?抓手是什麼?2025年6月,我在湖南湘西以“文化和科技融合能帶來怎樣的變化”為題談了些想法,現整理如下,供大家參考。
2025年5月,由中央宣傳部主辦的“2025文化強國建設高峰論壇”提出:要推動文化和科技融合,深入實施國家文化數字化戰略,用好人工智慧等前沿技術,加快文化建設數字化賦能、資訊化轉型。
這就是説,在文化和科技融合、數智化賦能之間,有兩個環節作為媒介或抓手,一是實施國家文化數字化戰略,二是用好人工智慧等前沿技術。
一、從當下炙手可熱的人工智慧談起
黨的二十屆三中全會《決定》在深化文化體制機制改革部分中強調一句話,即加快適應資訊技術迅猛發展新形勢(四中全會《規劃建議》在文化部分強調“順應資訊技術發展潮流”)。這是最應該引起宣傳思想文化戰線重視的內容。
習近平總書記向2019中國國際智慧産業博覽會致賀信時指出:當前,以網際網路、大數據、人工智慧等為代表的現代資訊技術日新月異,新一輪科技革命和産業變革蓬勃推進,智慧産業快速發展,對經濟發展、社會進步、全球治理等方面産生重大而深遠影響。
習近平總書記在中共中央政治局第九次集體學習時強調:人工智慧是引領這一輪科技革命和産業變革的戰略性技術,具有溢出帶動性很強的“頭雁”效應。
自2023年ChatGPT出世後,國內涌現了上百個人工智慧大語言模型,我們也在研究人工智慧如何在宣傳文化領域落地應用。但同技術公司、網際網路大廠等深入接觸後,我們感覺是人工智慧落地應用成本過高,大多數宣傳文化機構承受不起。
DeepSeek的橫空出世,打破了國際上“高算力和高投入是發展人工智慧唯一途徑”的迷信,開闢了一條低成本發展人工智慧的可行之路。
低成本是技術普及的基本要求,蒸汽機、電力和電腦的普及如此,人工智慧落地應用肯定也會走這條路。
人工智慧在宣傳文化領域落地應用,比成本更重要的問題是“幻覺”。
我問DeepSeek,人工智慧是否存在“偏科”現象?得到的答案是肯定的。DeepSeek還從技術上做出解釋:理工科知識通常有明確的結構化邏輯和標準答案,更適合AI的符號推理和模式匹配能力;人文社科涉及主觀性、文化語境、價值判斷等複雜維度,對模糊性和多樣性的處理能力仍是AI的短板。
“偏科”的後果就是“幻覺”,即生成與事實不符或文化背景錯位的虛構內容。
在歷史文化問題上的“幻覺”,這是意識形態管理不能容忍的,也是人工智慧落地應用的“一道坎”。
據DeepSeek透露:OpenAI內部評估顯示,約40%的幻覺可追溯至語料問題。
語料來源於數據。而數據恰恰是宣傳文化機構的天然優勢,數字化的人類知識成果,是當前人工智慧最短缺的“食糧”。
人工智慧有三要素,算力、演算法和數據。算力和演算法是科技的問題,數據是我們的優勢。
人工智慧是文化和科技雙向奔赴,是文化和科技融合的産物,用公式表達:
人工智慧=科技(算力+演算法)+文化(數據)
科技已經發力,文化不能缺席。
二、宣傳思想文化戰線每個單位手裏都有“牌”
數據從哪來?
2022年中共中央辦公廳 國務院辦公廳印發的《關於推進實施國家文化數字化戰略的意見》明確三個渠道:一是匯集,匯聚全國性文化資源普查數據;二是採集,採集中華民族文化基因數據;三是貫通,貫通已建或在建文化專題數據庫。
1、匯集,全國性文化資源普查數據量十分浩大:
——全國第三次文物普查顯示,全國共登記的不可移動文物共766722處,普查共製作電子數據包2868個,其中文本文件462.1萬個,各類圖紙156.8萬幅,照片228.1萬張,所佔空間近8TB;
——第一次全國可移動文物普查僅照片就5000萬張,數據總量超過140TB;
——共著錄登記漢文古籍270余萬部和藏文古籍1.8萬函,2861家單位參與並完成古籍普查登記工作,已累計完成645家收藏單位的《全國古籍普查登記目錄》,共計137種215冊,收錄147萬餘條款目;
——全國美術館藏品普查,藏品實際數量592663件,藏品圖片820288幅,數據總量6.9TB;
——全國現存348個劇種,參加普查的戲曲演出團體共有1.2萬個,共收入表格11萬份、圖片4.7萬張;
——被譽為“文化長城”、耗時30年完成的《中國民族民間文藝整合志書》,共計298卷、400冊,約4.5億字,收集相關資料逾50億字(包括曲譜、圖片)。
2、採集,包括開展紅色基因庫建設,對紅色紀念館藏品進行高精度採集、標注,並實現全國聯網,形成中華民族文化基因庫。在數據採集方面,故宮博物院保存約186萬件文物藏品,已有90萬件套實現了數字化採集,佔48%左右。中國國家博物館有約143萬件套,70萬件套實現數字化採集,約佔49%。中國美術館有約13萬件套藏品,有10萬件套已經實現了數字化採集,約佔76.9%。國家圖書館的古籍大約317萬冊件,目前有61萬冊件實現了數字化採集,約佔19.3%。
3、貫通,就是按照物理分佈、邏輯關聯原則,通過標識解析體系,把已建或在建的文化專題數據庫關聯起來,實現數據互聯互通,通過釋放數據解放文化生産力。
至於已建數據庫(媒資庫)就更多了。比如出版領域,具有一定規模的數據庫已經不少,期刊領域有同方知網、萬方數據、龍源期刊、維普期刊等大型期刊數據庫,在圖書領域有綜合性的國家數字圖書館、讀秀網、掌閱科技、中文線上、方正電子書等圖書數據庫,專題性的如人民出版社的中國共産黨思想理論資源數據庫、科學出版社的科學文庫、社科文獻出版社的皮書數據庫等,以及專業性的如中華古籍資源庫、愛如生、翰堂典藏、書同文等古籍數據庫等,還有許多出版社、報社建設了自己的數據庫。
三、文化資源數據如何從能源轉化為能量
數據是新能源,如何將其轉化為能量?這是我們需要進一步探索的問題。
1、數據不標注等於沒內涵
這些年,每個宣傳文化機構都擁有一定數量的數據,但由於大多數沒有標注,許多數據缺乏文化內涵,不能成為真正的生産要素。
數據成為文化創新創造的素材,需要進行深加工:一是要對文化數據進行科學分類。分類標準可參照聯合國教科文組織的文化統計框架,將數據劃分為六大類別,即文化和自然遺産、表演和節慶活動、視覺藝術和手工藝、書籍和報刊、視聽(音像)和交互媒體、設計和創意服務;二是按照專業性的知識圖譜進行編目,確定每個數據的方位;三是對文化資源數據的特徵進行描述並進行數據標簽化;四是為每一個元素級數據分配ISLI標識編碼。
數據標注具有很強的專業性,同時也是規模巨大的新興産業。
2、數據不標識不易被發現
數據標注完後不標識,別人無法發現。從2023年開始,我們在全國建立國家文化大數據標識基地,除了標注外,我們還需要做一個標識。
2021年10月,《文化資源數據分類與代碼》團體標準(/CPRA 301—2021)發佈,按照聯合國教科文組織劃分的六大類別進行分類,代碼採用七位代碼四級分類表示,其中,第1位使用英文大寫字母表示第一級分類,第2位~第3位用十進位表示指定二級分類代碼,第4位~第5位用十進位表示指定三級分類代碼,第6位~第7位用十進位表示四級分類代碼。
四、“數據+”動能轉換催生文化新質生産力
如何將能量轉化為生産力,即新質生産力,這是一個急迫問題。
新質生産力的核心要素也有三個,即新勞動對象、新勞動工具、新型基礎設施。如果不抓住這三個要素,文化新質生産力就無法變成現實。
1、新勞動對象
數據作為新型生産要素已經成為重要勞動對象,這已成為共識。但數據是要分類的,不是指數據分為公共的、個人的、商業的,而是指從供給和需求角度分類。
當下討論較多的數據,都是在消費過程中産生的,我稱之為需求側數據,這類數據通常包含個人資訊,因此確權較為困難。
還有另一類數據,我稱之為供給側數據,它能夠進入生産過程,成為二次創作素材,是真正意義上的生産要素。文化數據屬於這一類,數據的權屬非常清晰。
供給側數據和需求側數據所遵循的規律是完全不同的。這一點被忽略了,數據要素市場之所以不夠活躍,與沒有認識到數據實際上包含這兩類有直接關係。
2022年中辦國辦文件使用“文化資源數據”一詞,其用意是強調數據來源於文化資源,即文化資源數據是來源於文化資源的數據。
2、新勞動工具
提到新勞動工具,大家不約而同地指向了生成式人工智慧。
如前所述,幻覺率高是人工智慧在宣傳文化領域落地應用的“一道坎”,怎麼降低幻覺率是關鍵問題。
我提出一個觀點:人工智慧一定要分層,即基礎層、行業層和應用層,通過每一層來降低幻覺率。
在基礎層,即通用大模型訓練層,科技公司要攻克AI在人文社會科學方面的短板,將歷史文化特別是中華歷史和文化的數據轉化為語料,能夠“餵養”大語言模型,降低大語言模型在歷史文化方面的幻覺率。
在行業層,我提出了對象化模型的概念,怎麼理解?舉個例子,中國戲曲出版社接入開源大語言模型,運用自有數據研發出“戲曲模型”,通過蒸餾或其他方式提供給全國1888家院團使用,院團接入“戲曲模型”運用自有數據研發出場景模型,這樣做既可以把“幻覺率”降到最低程度,又可以讓人工智慧低成本落地應用,還可以打消院團數據外泄的顧慮。以此類推,中國文物出版社或中國文物報可以研發“文物模型”,供全國6000多家博物館使用。
每一個文化機構在開發場景應用時,通過私有化部署,用數據進一步降低幻覺率,人工智慧才可以真正地落地。
3、新型基礎設施
新型基礎設施,即資訊基礎設施或數據基礎設施,宣傳文化領域是否有數據基礎設施?
夯實文化數字化基礎設施,是2022年《關於推進實施國家文化數字化戰略的意見》文件明確的八項重點任務之一,即依託現有有線電視網路設施,廣電5G網路與互聯互通平臺,部署提供標識編碼註冊登記和解析服務的技術系統,完善結算支付功能,形成國家文化專網以及國家文化大數據體系的省域中心和區域中心,服務於文化資源數據的存儲、傳輸、交易和文化數字內容分發,這就是宣傳文化領域的新型基礎設施。
關聯形成中華文化數據庫,是2022年《關於推進實施國家文化數字化戰略的意見》文件明確的第一項重點任務,即依託資訊和文獻領域相關國際標準,在文化機構數據中心部署底層關聯服務引擎和應用軟體,按照物理分佈、邏輯關聯原則,關聯形成中華文化數據庫。
中華文化數據庫並非將所有宣傳文化機構的數據匯集在一起,而是按照統一的標準以及物理分佈、邏輯關聯原則,將零散的、不同領域、不同形態的數據關聯起來。
怎麼關聯?關聯的標準和介面必須統一。
標準統一就是依託我國提案創建的國際標準,即關聯標識符國際標準——ISLI(英文全稱International Standard Link Identifier),這是資訊與文獻領域唯一標識實體之間關聯關係的全球通用標識符,但不替代各個行業正在執行的標識符標準。
依託我國提案創建的關聯標識符國際標準(ISLI)進行技術架構,即在廣電網路公司機房部署提供標識編碼註冊登記和解析服務的技術系統、在文化機構數據中心部署底層關聯服務引擎和應用軟體,就可以形成了全國範圍內互聯互通的數據基礎設施,即國家數據局正在推動的“可信數據空間”,我稱之為“文化數字化的技術底座”。
五、接入國家文化專網輕鬆跨越“數字鴻溝”
如何跨越“數字鴻溝”,即完成數字化轉型升級,是所有宣傳文化機構面臨的棘手問題,也是非常大的挑戰。
宣傳文化機構在數字化轉型升級中的痛點主要有三個,第一是數據安全,第二是數據確權,第三是技術。
這幾年,我們組織成員單位基於國家文化專網開發了8項基礎性業務,包括數據安全、數據確權、數據加工、數據交易、數據分發、算力服務、人工智慧服務和數據資源入表服務等,每一項都直擊宣傳文化機構在數字化轉型升級過程中的痛點。
只要接入國家文化專網,宣傳文化機構就可以搭建一條文化數字化生産線,這條生産線整合了以上8項基礎性服務,為宣傳文化機構排憂解難。
文化人最擅長做內容,最不擅長做生意。
宣傳文化機構有兩塊短板,第一是經營,第二是技術。
實施國家文化數字化戰略,就是要解放文化人,讓他們從不擅長、不熟悉、不精通的業務中解放出來,專心做內容。
推動宣傳文化機構數字化轉型升級,一定要便捷化,便捷到文化數字化跟數位相機一樣簡單,用數位相機照相不需要懂光學原理,只要會取景、會按快門,就能照出好照片(好內容)。
實施國家文化數字化戰略催生出一條新賽道:
國家文化專網如同高速路,每一個宣傳文化機構如同跑在高速路上的新能源車,文化産權交易所如同高速路上的服務區,版權保護如同裝在新能源車上的ETC,8項基礎性服務可以整合到充電樁,新能源車只要能夠接通充電樁,就可以享受基礎性服務。
六、挖掘地域文化助力文化和旅遊深度融合
雖然我在文化和旅遊融合領域研究不多,但可以從另一個角度助力文化和旅遊深度融合,即挖掘地域文化。
過去我們不太講地域文化,實際上地域文化對整個旅遊帶來許多意想不到的好處。
只要有中華民族鮮明生活的地方,都有特色鮮明的地域文化,可以從中挖掘出許多有價值的內涵和內容。地域文化應該成為旅遊地文化體驗的重點。
在公共文化機構中,無論是地方誌還是檔案館、文化館、圖書館和博物館都與地域文化密切相關,這些都是地域文化的物化或者載體。
將原本收藏在地方誌、博物館、圖書館、美術館以及電臺電視臺的數據活化到旅遊景區,就可以實現白天看景、晚上體驗文化,留住遊客。
七、數字化賦能公共文化服務“即時可得”
2010年我們在制定國家“十二五”時期文化改革發展規劃綱要時,曾提出一個“公共文化服務圈”的概念,城市叫“15分鐘服務圈”,農村叫“1小時服務圈”。其實,在數字化時代,公共文化服務不存在時間差,無論在什麼地方,在什麼時間都可以享受到公共文化服務。即時可得應當成為數字化時代公共文化服務應當追求和能夠實現的目標。
黨的二十屆三中全會明確提出要完善公共文化服務體系,建立優質文化資源直達基層機制。我們在10多年前進行過探索,即電視圖書館實驗項目,將其作為“十二五”時期文化數字化建設的先導工程。
該項目把電視機作為公共圖書館的終端,通過有線電視網路將百萬圖書進入千萬家庭。2012年在北京歌華有線進行試點,2017年擴大到其他9個省市,覆蓋5000萬高清用戶。
該項目證明,優質文化資源直達基層是可以實現的,文化企業也可以承擔公共文化服務的任務(通過政府購買)。
更為重要的是,電視圖書館試驗項目運作7年多,沒有發生過一起盜版事件,充分證明數據安全是有保障的。
八、數字化文化消費新場景“近在咫尺”
2022年《關於推進實施國家文化數字化戰略的意見》文件明確提出:整合全息呈現、數字孿生、多語言交互、高逼真、跨時空等新型體驗技術,大力發展線上線下一體化、線上在場相結合的數字化文化新體驗。
數字化文化消費新場景包括線上和線下兩部分,線上主要是指大屏和小屏,大屏主要指電視機;線下包括新時代文明實踐中心、學校、公共圖書館、文化館、博物館、美術館、影劇院、新華書店、農家書屋等文化教育設施,以及旅遊服務場所、社區、購物中心、城市廣場、商業街區、機場車站等公共場所。
文化重在體驗,這點大家都已經認識到了,但文化體驗需要場景。現在的技術已經實現,只要有空間就能營造出場景。在這方面宣傳文化系統大有可為。公共文化設施存在閒置、利用率不高的問題,文化體驗可以彌補這個問題。
《關於推進實施國家文化數字化戰略的意見》明確提出,要鞏固和擴大中華文化數字化創新成果的展示空間,包括在旅遊服務場所、城市廣場等建設文化體驗園,在學校、公共圖書館、文化館、博物館、美術館等建設文化體驗館,在影劇院、新華書店、農家書屋、社區、購物中心、城市廣場、商業街區、機場車站等建設文化體驗廳。
總而言之,可以將數據活化到數字化文化消費新場景之中。
文化消費並非僅通過發放幾張消費券就可以解決。我一直強調一個觀點,在文化領域供給決定需求,並非是大家不消費,而是沒有提供優質産品吸引大家消費。
中央一直強調供給側結構性改革,在宣傳文化領域如何推進?需要探討如何激活文化資源,將其轉化為數據,並利用這些數據打造新的場景和産品。
我有個預言:未來3到5年內,文化體驗將成為文化消費的主流。
(本文作者高書生,係中共中央宣傳部原文改辦副主任、一級巡視員)








