來源標題:“識典古籍”測試版上線,改善古籍閱讀體驗的新嘗試
如果有人突然對《楚辭》感興趣,想線上查看電子文本和影印版,過去可能要在不同的網路檢索半天,當下有了一個新的選擇。
近日,由北京大學—字節跳動數字人文開放實驗室研發的古籍數字化閱讀平臺“識典古籍”測試版正式上線。目前,該平臺涵蓋390部經典古籍,主要來自《四部叢刊》,共計3000多萬字,未來三年將陸續上線一萬種儒釋道經典書目,免費開放也是它的特點之一。
如果説像《楚辭》這類大眾耳熟能詳的古籍,很多商業網站也能查詢到,那麼如果有人想看《六臣注文選》《廣成集》《朱文公校昌黎先生集》這些經典但相對冷門的古籍,選擇就會少很多。而要線上免費查閱到權威準確的影印本,更是難上加難。
個中原因不難理解。要滿足看似簡單的古籍線上閱讀需求,其實需要一系列高難度的前提條件疊加:要有權威的古籍資源,要有先進的數字化技術,要有專業的學術把關“翻譯”能力,這些條件和所耗費的資源顯然不低。説白了,這只能是一項超越市場邏輯的公益事業。
“識典古籍”平臺的價值,由此可見一斑。超越直接的經濟計算,從文脈傳承、文化責任的維度考量,才能誕生這樣的平臺。
中國人向來重視文脈傳承,傳承的當然不只是古籍的物質載體,而是要讓先賢的智慧洞見潤物無聲地內化進一代一代國人心裏。保護紙質載體,最終其實也是為了給更多人閱讀提供可能。基於此目的,降低獲取門檻,讓更多人能便利地看到古籍內容,就是古籍保護的自然邏輯。
數字化為古籍的開放創造了條件,但要確保開放的效果,僅僅免費還遠遠不夠。因為古籍本身還有閱讀門檻,對於多數普通人甚至是一些古籍愛好者來説,要流暢閱讀那些繁體的沒有標點的古籍,難度並不低。所以在數字化的過程中,還得考慮如何改善“閱讀體驗”,讓開放平臺的效果最大化。
“識典古籍”有字節跳動專業的數字化技術加持,有北大領軍的學者和文獻專家團隊審核和校對,是閱讀體驗能不斷改善的保障。當然,目前來看平臺還有提升空間。比如典籍數量相對較少,文字識別、標點錯誤率還需進一步改善等。這有賴於數字化技術提升,學術人員的持續參與貢獻,以及平臺大數據處理“經驗”的不斷迭代升級。
所幸,“開放”已成為這個平臺的底色,在平臺的設計中,不僅向社會開放古籍閱讀檢索功能,還鼓勵擁有文獻的學者自行上傳文獻,用戶甚至可參與再創作和再闡釋。這也就意味著,古籍的規模會越來越大,“糾錯”能力越來越強,對普通讀者的友好度也會越來越高。
相對於傳統的紙質古籍閱讀,數字化的優勢顯而易見,比如可以儲存更久,可以觸達更多讀者,可以全方位降低閱讀門檻等。這是一個多方力量匯聚的平臺。當古籍保護擁有了公益和開放的底色,中華文脈也就自然可以得到更好的傳承。
如果有人突然對《楚辭》感興趣,想線上查看電子文本和影印版,過去可能要在不同的網路檢索半天,當下有了一個新的選擇。
近日,由北京大學—字節跳動數字人文開放實驗室研發的古籍數字化閱讀平臺“識典古籍”測試版正式上線。目前,該平臺涵蓋390部經典古籍,主要來自《四部叢刊》,共計3000多萬字,未來三年將陸續上線一萬種儒釋道經典書目,免費開放也是它的特點之一。
“識典古籍”項目負責人現場講解
如果説像《楚辭》這類大眾耳熟能詳的古籍,很多商業網站也能查詢到,那麼如果有人想看《六臣注文選》《廣成集》《朱文公校昌黎先生集》這些經典但相對冷門的古籍,選擇就會少很多。而要線上免費查閱到權威準確的影印本,更是難上加難。
個中原因不難理解。要滿足看似簡單的古籍線上閱讀需求,其實需要一系列高難度的前提條件疊加:要有權威的古籍資源,要有先進的數字化技術,要有專業的學術把關“翻譯”能力,這些條件和所耗費的資源顯然不低。説白了,這只能是一項超越市場邏輯的公益事業。
“識典古籍”平臺的價值,由此可見一斑。超越直接的經濟計算,從文脈傳承、文化責任的維度考量,才能誕生這樣的平臺。
中國人向來重視文脈傳承,傳承的當然不只是古籍的物質載體,而是要讓先賢的智慧洞見潤物無聲地內化進一代一代國人心裏。保護紙質載體,最終其實也是為了給更多人閱讀提供可能。基於此目的,降低獲取門檻,讓更多人能便利地看到古籍內容,就是古籍保護的自然邏輯。
數字化為古籍的開放創造了條件,但要確保開放的效果,僅僅免費還遠遠不夠。因為古籍本身還有閱讀門檻,對於多數普通人甚至是一些古籍愛好者來説,要流暢閱讀那些繁體的沒有標點的古籍,難度並不低。所以在數字化的過程中,還得考慮如何改善“閱讀體驗”,讓開放平臺的效果最大化。
“識典古籍”頁面截圖
“識典古籍”有字節跳動專業的數字化技術加持,有北大領軍的學者和文獻專家團隊審核和校對,是閱讀體驗能不斷改善的保障。當然,目前來看平臺還有提升空間。比如典籍數量相對較少,文字識別、標點錯誤率還需進一步改善等。這有賴於數字化技術提升,學術人員的持續參與貢獻,以及平臺大數據處理“經驗”的不斷迭代升級。
古籍數字化過程視頻截圖
所幸,“開放”已成為這個平臺的底色,在平臺的設計中,不僅向社會開放古籍閱讀檢索功能,還鼓勵擁有文獻的學者自行上傳文獻,用戶甚至可參與再創作和再闡釋。這也就意味著,古籍的規模會越來越大,“糾錯”能力越來越強,對普通讀者的友好度也會越來越高。
相對於傳統的紙質古籍閱讀,數字化的優勢顯而易見,比如可以儲存更久,可以觸達更多讀者,可以全方位降低閱讀門檻等。這是一個多方力量匯聚的平臺。當古籍保護擁有了公益和開放的底色,中華文脈也就自然可以得到更好的傳承。
關於我們 合作推廣 聯繫電話:18901119810 010-88824959 詹先生 電子郵箱:zht@china.org.cn
版權所有 中國網際網路新聞中心 京ICP證 040089號-1 網際網路新聞資訊服務許可證 10120170004號 網路傳播視聽節目許可證號:0105123